10.3969/j.issn.1000-3428.2016.09.028
基于HITS的冲突Deep Web数据多真值发现算法
目前多数真值发现算法建立在真值唯一的基础上,无法处理多真值的情况.为此,针对冲突Deep Web数据的多真值发现问题,借鉴HITS算法思想,定义视图权威度与视图描述可信度,两者相互影响.在此基础上,定义视图链接关系图,提出多真值迭代发现算法MTF.当算法收敛时,权威度最大的视图就是真值.在Book-Authors数据集上进行实验,结果表明,与基准算法VOTE相比,MTF算法的精确度大幅提高.
Web数据源、数据模型、可信度、视图、真值发现
42
TP311(计算技术、计算机技术)
国家社科基金资助项目“基于大数据整合的空气质量测度方法研究”14GSD95;全国统计科研基金资助重点项目“海量异源异物数据的采集、存储和分析方案研究”2013LZ44;陇原创新人才扶持计划基金资助项目14GSD95;甘肃省财政厅高校基本科研业务费基金资助项目GZ14007,GZ14023
2016-11-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
158-162