10.13774/j.cnki.kjtb.2017.11.030
基于多视角聚类模型的微博文本数据挖掘算法研究
本文提出了一种能够同时考虑关键词和发生时间的新型算法.该算法首先对数据预处理后,建立微博事件集合的LDA模型,生成主题词集合作为事件的描述标志,通过DTW算法对事件关键词间的语义、时序相似度进行计算,得到对应的相似度矩阵,最后采用协同训练普聚类方法,迭代生成最终的特征向量并完成事件选取.仿真实验结果表明,本文提出的算法同以往算法相比具有准确率高以及效率高的特点.
微博文本、文本数据挖掘、多视角、相似矩阵
33
TP301.6(计算技术、计算机技术)
2017-12-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
129-132