10.3969/j.issn.1000-1220.2014.02.004
基于数据源依赖性的Deep Web数据融合方法
在Deep Web数据挖掘中,不同数据源之间往往会出现数据冲突,如何解决冲突从而获得正确值(这一过程称为数据融合)是数据集成中的一个关键问题.提出一种考虑数据源之间依赖关系的数据融合方法.该方法利用贝叶斯分析确定数据源之间的依赖性,设计出检测依赖性和融合数据的迭代算法;并通过考虑数据源的准确度和属性值之间的相似性等条件扩展模型.使用该方法,对网上爬取的真实数据进行了实验,结果表明它能够显著提高数据融合的准确度,而且在大量数据源存在的情况下具有可扩展性.
数据集成、数据融合、数据源依赖性、数据源准确度
35
TP391(计算技术、计算机技术)
国家自然科学基金项目60970015,61003054,61170020;江苏省高校自然科学研究项目10KJB520018;苏州市科技支撑计划项目SG201257
2014-04-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
210-216