在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:SPuerBRead/HTMLSimilarity开源软件地址:https://github.com/SPuerBRead/HTMLSimilarity开源编程语言:Python 100.0%开源软件介绍:HTMLSimilarity根据网页结构判断页面相似性(Determine page similarity based on HTML page structure) 使用方法
说明输入参数:
返回值:
判断方法根据网页的DOM树确定网页的模板特征向量,对模板特征向量计算网页结构相似性。 详细参考:李景阳, 张波. 网页结构相似性确定方法及装置:. 原理参考上述专利文章,对其判断相似性部分进行简单实现。 用途判断越权时,需要对response进行对比,当后端返回渲染后HTML的情况下,无法直接判断是否出现了越权,利用常规的文本相似度对比如difflib,通过分词或最长公共子串等方法进行判断并不适用于用来判断越权,所以使用根据页面结构判断相似度,确定是否出现了越权。 |
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论