DOI：10.3969/j.issn.1001-7119.2013.10.067

复杂属性环境下的Web错误数据挖掘算法研究

引用

摘要：

Web信息复杂程度不断加深，多维度、高复杂度的信息越来越多，信息中的错误信息特征在海量复杂数据属性中表述越来越困难，造成信息挖掘耗时过长，挖掘效果不好的问题。为了解决这一问题，提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中，运用距离描述Web数据的错误数据特征，运用模糊信息熵，对错误数据特征进行距离分类，保证数据分类的准确性，最大程度的完成错误数据高效挖掘。实验结果表明，该算法能有效减少错误数据信息在海量信息中的挖掘时间，提高了挖掘的准确性，取得了满意的效果。

关键词：web数据、距离、信息熵

分类号：TP393(计算技术、计算机技术)

在线出版日期：2013-11-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：202-204

英文信息展示

期刊专题