10.3969/j.issn.1673-629X.2014.01.034
基于VSM和LDA模型的FAQ问答系统
传统的搜索引擎返回的数据太过庞大,很多情况下用户不能快速地找到自己要的答案。在这种情况下,文中引入FAQ系统。 FAQ中如何找到最佳匹配答案,是文中的研究重点。改进了传统的VSM模型,使得它能更好地体现问题中词的权重。重点引入了LDA模型,并用计算机故障领域内的文档资料对它进行训练,得到主题-词的概率分布。通过主题-词中词的概率分布,计算词与词的相关度,提出通过词与词间相关度计算句子与句子间相似度的算法。对两个算法进行综合,得到最终的相似度算法。文中对FAQ进行整理,得到了FAQ问答系统的雏形。通过实验分析,说明相似度算法有很好的效果。
VSM、相似度计算、LDA (Latent Dirichlet Allocation)、主题-词分布
TP31(计算技术、计算机技术)
安徽省自然科学基金资助项目11040606M133
2014-01-22(万方平台首次上网日期,不代表论文的发表时间)
共3页
133-135