10.16652/j.issn.1004-373x.2015.24.012
基于TF-IDF改进聚类算法的网络敏感信息挖掘
网络敏感信息挖掘过程中,敏感信息和正常信息的特征不同,具有较高的遮蔽性。利用传统敏感信息挖掘方法时,固有的敏感信息被遮蔽,无法进行敏感信息的准确挖掘。提出基于TF?IDF改进聚类算法的网络敏感信息挖掘方法,通过TF?IDF方法获取网络敏感信息文本,在网络敏感信息文本中获取有价值的敏感信息特征,采用该信息完成聚类算法,对全部敏感信息特征进行聚类分析,完成网络敏感信息的挖掘。实验结果说明,所提方法进行网络敏感信息挖掘,具有较高的挖掘效率和精度。
TF-IDF、聚类分析、网络敏感信息、信息挖掘
TN911-34;TP33
2015年河南省高等学校重点科研项目基于数据挖掘的反恐情报分析技术研究15B520027;2015年河南省高等学校重点科研项目基于大数据的公安信息化应用技术研究15A120014
2016-01-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
44-46,49