10.3969/j.issn.1002-137X.2014.03.048
一种解决“中心主题湮没问题”的基于图模型的Labeled-LDA文本分类算法
隐含狄利克雷分配(LDA,Latent Dirichlet Allocation)是一种用于挖掘文档集中潜在主题信息的无监督主题模型.而LDA模型的变形Labeled-LDA则可以作为有监督的多标签分类器,它建立了主题与标签的一一映射,从而学习出词与标签之间的关系.近年来,图模型在文本挖掘方面的应用取得了良好的效果,通过对文档建立图模型,为进一步分析文档的语义提供了新的途径.提出了一种利用Labeled-LDA和文档图模型进行文本分类的新算法,与传统的LDA模型方法相比,该方法的性能有较大的提高.
文本分类、图挖掘、图模型、隐含狄利克雷分配
41
TP391.1(计算技术、计算机技术)
中科院十二五信息化项目“科研信息化应用推进工程”XXH12503
2014-04-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
223-227