应用信息论的数据导向模式匹配方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3778/j.issn.1673-9418.1305044

应用信息论的数据导向模式匹配方法

引用
随着计算机网络的发展,许多复杂庞大的异构数据集应运而生.为了有效利用这些异构数据,通常采用数据集成的方法,其中模式匹配是数据集成的核心技术.然而,许多数据集具有典型的异构性,并可能存在有重复数据、缺失数据、模式信息缺失等问题,导致传统的模式匹配技术无法适用.为此,研究了模式信息未知或者不完整情况下的模式匹配问题,提出了应用信息论的模式匹配模型.该模型完全基于数据分布的特点而不依赖于任何外部知识,能够准确地计算出属性列之间的相似度,并有效地描述数据集中各个属性列数据的分布特点和属性列之间的关联关系.还提出了构建原始数据分布图和演化数据分布图的算法,从而形式化地表达出属性列之间的关系,达到匹配的目的.在真实数据集上的综合实验评估证明了方法的可行性和有效性.

模式匹配、数据导向、信息论模型

7

TP391(计算技术、计算机技术)

The National Natural Science Foundation of China under Grant Nos.61033007,61003060;the National Basic Research Program of China under Grant No.2012CB316201国家重点基础研究发展计划973计划;the Specialized Research Fund for the Doctoral Program of Higher Education of China under Grant No.20120042110028;the MOE-Intel Special Fund of Information Technology under Grant No.MOE-INTEL-2012-06;the Fundamental Research Funds for the Central Universities of China under Grant No.N100704001

2013-10-10(万方平台首次上网日期,不代表论文的发表时间)

共12页

819-830

相关文献
评论
暂无封面信息
查看本期封面目录

计算机科学与探索

1673-9418

11-5602/TP

7

2013,7(9)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn