基于联合分类器过滤噪声的微博主题发现
伴随着互联网的广泛流行,以微博为代表的社交网络产生了大量的数据.从这些数据中挖掘到有用的信息成为当今研究的一项重要方向.根据微博文本的特点,本文提出来一种基于联合分类器过滤掉噪声微博,然后利用LDA模型进行主题发现.联合分类器模型是由朴素贝叶斯、支持向量机和决策树三种模型通过简单投票机制结合构成的,实验结果联合分类器的准确度达到87%,显然这种分类方法是可行的,也是有效的.
支持向量机、朴素贝叶斯、决策树、联合分类器、LDA模型
27
G25;TP3
中科院STS项目KFJ-SW-STS-144;宁夏科技攻关项目ZNNFKJ2015-04
2018-01-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
132-136