基于冲突依赖消除的网络表格外键检测算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11896/jsjkx.180901748

基于冲突依赖消除的网络表格外键检测算法

引用
作为数据库中最重要的约束之一,外键关系对数据分析与集成有着重要的意义.大量的网络表格缺乏显式指定的外键,但外键关系对于理解和利用网络表格至关重要.目前的研究工作主要集中于对属性间包含依赖的查找,一些传统关系表格上的外键关系检测方法无法解决网络表格的异构性而产生的大量冲突外键.综合考虑网络表格间的冲突依赖,提出了一种基于冲突依赖消除的网络表格外键检测算法.首先提出冲突依赖的概念,据此对候选外键关系建立包含依赖图;然后构建包含依赖图的层结构,并给出候选外键关系的强度定义;最后在逐层消除冲突依赖的基础上,筛选出真正的外键关系.为验证算法的有效性,实验数据集分别选择了具有完整模式规范的W IK I数据集,以及缺少模式信息的DWTC数据集和WDC数据集.基于以上数据集,将提出的算法与其他两种外键检测方法进行精确率、召回率以及F值的对比.实验结果表明,提出的算法在WIKI数据集和DWTC数据集上的精确率、召回率和F值均高于现有算法;在最新的大型网络表格数据集WDC中,所提算法的精确率、召回率和F值高达0.89,0.88和0.89,且大大优于其他算法.因此,与现有的方法相比,所提算法更适用于网络表格,同时具备更高的精确率、召回率以及F值.

外键、冲突依赖、网络表格、约束

46

TP391(计算技术、计算机技术)

国家重点研发计划 2018YFC0809800 ,中央高校基本科研业务费专项资金2017YJS065

2019-11-22(万方平台首次上网日期,不代表论文的发表时间)

共7页

195-201

相关文献
评论
暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

46

2019,46(10)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn