10.3969/j.issn.1673-8012.2011.06.019
基于信息增益的LDA模型的短文本分类
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.
信息增益、LDA模型、文本分类
30
TP301.2(计算技术、计算机技术)
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
64-66