10.3778/j.issn.1673-9418.1612024
Web大数据系统数据源选择
如何从数量众多的Web数据源集合中选择数量合适的数据源,使得在满足特定查询需求的前提下尽可能地减少访问数据源的数量,是Web大数据系统集成中的关键问题之一.提出了一个两阶段数据源选择方案:第一阶段通过各个数据源模式与中间模式的相似度选择与查询相关度高的数据源,通过计算依赖数据源的质量来选取质量较好的数据源;第二阶段基于最大熵理论计算数据源之间的重复率,设计实现了一个查询最小代价模型动态选择数据源算法.最后在实验平台上对算法进行了评估,实验表明该算法具有较高的效率与扩展性.
Web大数据、数据源选择、数据源质量、数据源依赖
12
TP311(计算技术、计算机技术)
The National Natural Science Foundation of China under Grant No.61139002
2018-03-30(万方平台首次上网日期,不代表论文的发表时间)
共10页
360-369