10.3969/j.issn.1006-9348.2018.09.069
非结构化网络分布式差异数据实时挖掘仿真
非结构化网络具有数据量大、异常分散、复杂性高的特点,传统方法通过欧几里德距离衡量特性因子,将特异性因子较大的数据看作差异数据,容易受网络环境影响,导致挖掘结果不可靠.为此提出一种新的非结构化网络分布式差异数据实时挖掘方法.通过HISTORY系统对非结构化网络数据进行实时采集.通过信息熵衡量连续型随机变量,求出各时间段内非结构化网络数据若干特征要素的熵值,按照熵值对数据进行分类.通过独立分量分析将正常数据信号和差异数据信号分离.通过形成频繁项集和形成强关联规则两个步骤对非结构化网络分布式差异数据进行关联分析.依据强关联规则求出支持度与置信度,通过比较数据强关联规则的相似度实现差异数据的实时挖掘.实验结果表明,所提方法能够有效实现差异数据实时挖掘,与其它方法相比挖掘结果更加准确.
非结构化网络、分布式、差异数据、实时挖掘
35
TP309(计算技术、计算机技术)
教育部科技发展中心基金课题2017B00011
2018-11-06(万方平台首次上网日期,不代表论文的发表时间)
共5页
333-337