10.3969/j.issn.1000-3428.2017.02.009
大数据环境下Web数据源质量评估方法研究
在大数据环境下Web数据资源的开放性和多源性使得不同互联网平台提供的数据质量参差不齐,严重影响人们从互联网中有效准确地获取信息.为此,提出一种Web数据源质量评估方法.建立面向多源互联网平台的统一数据模型和数据质量标准模型,给出针对大数据全样本数据分析的质量标准度量和表示方法,并通过多维数据质量的综合评估实现Web数据源质量的统一度量.实验结果表明,该方法能全面度量互联网平台的数据质量,为用户提供准确高效的质量评价结果.
大数据、Web数据源、数据质量评估、全样本分析、MapReduce框架
43
TP391(计算技术、计算机技术)
国家自然科学基金61502350,61672393,U1536114;中央高校基本科研业务费专项资金项目2042014kf0057;湖北省自然科学基金2014 CFB289
2017-05-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
48-56