不确定关系数据属性级溯源表示与概率计算
传统的数据库应用中,数据往往被假定是精确可用的,而实际中数据普遍存在不确定性.以往许多利用溯源信息追踪数据不确定性的方法往往关注元组或单一属性存在不确定性的情况,通过对元组添加唯一变量标识,用变量标识所表示的溯源信息构造布尔表达式计算结果元组概率.当元组中多个属性存在不确定性时,对元组进行标识不能帮助用户快速而准确地找到造成不确定性的源属性值.定义属性表达式,并通过属性表达式构造溯源表达式.利用该溯源表达式不仅可以准确地追溯不确定性产生的具体位置,同时还可以实现结果元组的概率计算.为保证概率计算结果的正确性,提出溯源表达式的转换算法.通过分析影响结果元组概率计算效率的因素,还提出构建共享路径表的方法,在构建过程中对原子析取式进行预计算,以提高概率计算的效率.实验部分将该方法与现有的元组级溯源信息表示方法在时间代价和空间代价方面进行比较,验证其可行性和有效性.此外,实验部分还对利用共享路径加快结果元组概率计算的有效性进行了评估.
不确定性、属性表达式、溯源表达式、概率计算、共享路径
25
TP311(计算技术、计算机技术)
国家自然科学基金61232002,61202033;国家高技术研究发展计划8632012AA011004;教育部博士点新教师基金200804861067;湖北省自然科学基金2011CDB448;武汉大学博士研究生自主科研基金2012211020207
2014-06-06(万方平台首次上网日期,不代表论文的发表时间)
共17页
863-879