10.19678/j.issn.1000-3428.0052033
基于主题分布优化的模糊文本分类研究
在对类别模糊的文本进行分类时,主题模型只考虑文档和主题级别信息,未考虑底层词语间的隐含信息,且多数主题信息复杂、中心不明确.为此,提出一种改进的文本分类方法.通过分位数选择中心明确的主题,将其映射到word2vec词向量空间内,对模糊文本进行分类操作,进而得到文本分类结果.实验结果表明,与C_LCD+KNN方法相比,该方法分类效果较好,鲁棒性较强.
主题模型、词向量、模糊文本、语义分析、分位数
45
TP391.43(计算技术、计算机技术)
国家自然科学基金51605134;河北省博士后科研项目2012-14;京津冀协同创新共同体建设专项18246224D
2019-11-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
221-226