10.3969/j.issn.1002-137X.2010.11.043
基于Zipf分布与属性相关性的选择性估计
在Deep Web数据集成中,集成查询接口和很多Web数据库查询接口用合取谓词表达查询,但是也有相当一部分Web数据库的查询接口用互斥谓词表达查询,这意味着查询转换时每次只能选择一个谓词.因此,准确、高效地估计每个互斥查询的选择性是优化查询转换的关键.提出了基于Zipf分布与属性相关性的选择性估计方法.通过属性之间的相关性从Web数据库上获取该属性近似随机的属性级样本,在此基础上计算属性值的Zipf分布方程,进而推断该无限值属性的任意值的选择性.实验表明,该方法可以准确、高效地估计各互斥查询的选择性.
Zipf分布、属性相关性、选择性估计
37
TP311(计算技术、计算机技术)
国家自然科学基金60773216
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
184-189