10.3969/j.issn.1006-9348.2017.02.092
非结构化网络中有价值信息数据挖掘研究
对非结构化网络中有价值信息数据挖掘的研究,可更好的提升非结构化海量网服务质量.采用当前方法进行数据挖掘时,需要对信息数据先进行降噪,但降噪过程较为复杂,挖掘方法局限性大.提出基于关联规则的非结构化网络中有价值信息数据挖掘方法.利用特征提取方法对文本特征进行初步的分类与识别,提取不同文本类型的特征,利用关联规则方法计算各个类型特征间的关联度,将不同文本类型特征中较为明显的词作为聚类的对象,搜索出在给定样本数据上具有最大后验概率的文档划分方案,将每个文档信息作为其类别形成的随机符号序列,采用最大似然估计计算出各个符号的频率分布,利用计算的结果完成对信息数据挖掘.仿真结果表明,所提方法可扩展性较强,可以有效地完成对非结构化网络中有价值信息数据挖掘.
非结构化网络、有价值信息、数据挖掘
34
TP391(计算技术、计算机技术)
2017-05-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
414-417