10.19678/j.issn.1000-3428.0047862
基于改进Labeled LDA模型的科技视频文本分类
在对科技领域视频文本进行分类时,容易忽略分类贡献度较高的专业名词.为此,改进传统Labeled潜在Dirichlet分布(LDA)模型,建立用于科技领域视频文本的MulCHI-Labeled LDA模型,避免偏向高频词的现象.通过构建领域术语库以突出专业名词,同时使用卡方加权和文本位置加权算法提升主题词质量.实验结果表明,与Labeled LDA模型相比,该模型可以解决专业名词被忽略的问题,并能有效提高主题词质量和分类准确率.
科技视频、文本分类、标签、卡方加权、领域术语库
44
TP391(计算技术、计算机技术)
2018-12-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
274-279