10.3969/j.issn.1672-9722.2012.11.003
支持起源回溯的最小化标识属性传播
数据起源主要描述数据的来源及随时间演化的过程.最小化查询数据表的标识属性传播是一个亟待解决的问题.通过构建等值传播链表EPL描述查询中的等值连接及其传递性,并基于EPL给出朴素标识属性传播方法实现高效溯源信息传播.然而标识属性通过等值连接可以识别非标识属性数值,简单地传播数据表的标识属性数值导致起源数据冗余传播.为避免溯源信息冗余,提出完全标识属性传播格及其剪枝策略,给出基于格剪枝的最优标识属性传播方法,实现溯源信息的最小代价传播.基于TPC-H Benchmark和人造数据集IAP-DB的实验结果验证了提出的基于标识属性传播的溯源方法可以高效实现数据起源信息传播.
数据起源、标识属性、属性传播、剪枝
40
TP311.13(计算技术、计算机技术)
国家自然科学基金60973018,60973020;教育部博士点基金20110042110028;中央高校基本科研业务费专项基金N110804002,N100704001
2013-01-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
10-13,28