10.3969/j.issn.1672-9722.2020.05.028
一种面向WEB页面的标记聚类方法
针对Web测试中现有Web页面聚类方法无法准确描述复杂页面结构、页面聚类准确度低、时间复杂度高的问题,分析了Web页面的DOM结构和节点属性,给出改进的树匹配算法衡量Web页面间相似度,并提出一种新的标记聚类方法实现Web页面聚类.通过实验对比验证所提出的方法能够有效处理复杂Web页面结构,且聚类准确度高,时间复杂度低,是一种高质量的Web页面聚类方法.
Web测试、Web页面相似度、聚类
48
G354(情报学、情报工作)
国家自然科学基金项目编号:61672085
2020-07-15(万方平台首次上网日期,不代表论文的发表时间)
共7页
1148-1153,1200