10.3969/j.issn.1007-757X.2016.03.023
基于LPAL模型的超文本分析
PLSA和LDA主题模型主要是研究纯文本内容.最近,开始提出用主题模型处理超文本,所提出的超文本模型是生成模型,引出了词和超链接的关系.由于超文本的文档词分布不仅由文档主题决定,也由引用的文档的主题决定.因此提出了一种基于主题模型的LPAL (Link PLSAAnd LDA)模型处理超文本的主题发现和文档分类.和传统的主题模型一样,该主题模型进一步的表示了词的分布.实验结果表明,该模型在主题发现和文档分类要优于传统的LDA和Link-LDA模型.
超文本、LPAL、主题发现、文档分类
32
TP311(计算技术、计算机技术)
2016-08-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
77-80