10.3969/j.issn.1000-7024.2014.01.033
多数据源冲突的主数据真值发现算法
为了解决多数据源冲突的主数据真值发现问题,基于对冲突数据值之间的支持度往往是非对称的直观认识,提出了一种非对称的数据值支持度计算算法;该算法改进了目前真值发现算法中以数据值之间的相似度代替支持度的对称算法.在考虑了数据值的可信度取决于数据源权威度和数据值支持度的基础上,提出了TRFinder迭代算法,并在TRFinder算法的基础上给出了主数据生成算法.通过对典型的books_authors数据集和模拟数据进行实验,实验结果表明,TRFinder算法比Vote算法与TruthFinder算法具有更高的准确率并保留了更多的真值信息,验证了算法的有效性.
多数据源、真值发现、主数据集成、数据值支持度、数据冲突
35
TP311(计算技术、计算机技术)
国家科技支撑计划课题基金项目2012BAF12B14
2014-03-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
177-182