10.3969/j.issn.1001-0548.2014.06.017
基于模糊偏序关系支持度模型的真值发现算法
为了解决主数据集成、web数据集成中的真值发现问题,提出了一种基于模糊偏序关系支持度计算模型的真值发现算法(FA-SDCM)。针对已有算法中,以描述相似度替代描述支持度进行计算,忽视了描述所含真值信息的不对称性问题,在分析描述本身特性的基础上,提出了描述蕴含概念,定义了基于模糊偏序关系的支持度计算模型,较好地解决了描述所含真值信息的不对称性问题。在考虑了数据源可信度及描述之间支持度对真值发现影响的基础上,基于迭代思想,提出了FA-SDCM算法。在Books-Authors数据集上进行实验,结果表明FA-SDCM算法比Vot e算法与TruthFinder算法具有更高的准确率。
不对称性、描述蕴含、模糊偏序关系、支持度模型、真值发现
TP311(计算技术、计算机技术)
国家科技支撑计划项目2012BAF12B14;国家自然科学基金51475097;贵州省科技项目黔科合JZ字[2014]2001、黔科合计Z字[2012]4009
2015-01-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
893-897