基于层次狄利克雷过程的交互式主题建模
随着信息技术的快速发展,大量的文本数据产生、被收集和存储.主题模型是文本分析的重要工具之一,被广泛地应用于分析大规模文本集.然而,主题模型通常无法直观而有效地结合用户的领域专业知识对模型结果进行修正.针对这一问题,提出了一个交互式可视分析系统,帮助用户对主题模型进行交互修正.首先对层次狄利克雷过程进行了改进,使其支持单词约束;然后,使用矩阵视图对主题模型进行展示,并使用语义相关的词云布局帮助用户寻找单词约束,用户通过添加单词约束迭代优化主题模型;最后,通过案例分析及用户研究来评价该系统的可用性.
文本可视化、主题模型、文本分析、层次狄利克雷过程
TP391(计算技术、计算机技术)
国家自然科学基金61472354;国家高技术研究发展计划8632012AA12A404 National Natural Science Foundation of China61472354;National High-Tech R&D Program of China 8632012AA12A404
2016-06-22(万方平台首次上网日期,不代表论文的发表时间)
共13页
1114-1126