DOI：10.3969/j.issn.1673-629X.2014.01.034

基于VSM和LDA模型的FAQ问答系统

引用

摘要：

传统的搜索引擎返回的数据太过庞大，很多情况下用户不能快速地找到自己要的答案。在这种情况下，文中引入FAQ系统。 FAQ中如何找到最佳匹配答案，是文中的研究重点。改进了传统的VSM模型，使得它能更好地体现问题中词的权重。重点引入了LDA模型，并用计算机故障领域内的文档资料对它进行训练，得到主题-词的概率分布。通过主题-词中词的概率分布，计算词与词的相关度，提出通过词与词间相关度计算句子与句子间相似度的算法。对两个算法进行综合，得到最终的相似度算法。文中对FAQ进行整理，得到了FAQ问答系统的雏形。通过实验分析，说明相似度算法有很好的效果。

关键词：VSM、相似度计算、LDA (Latent Dirichlet Allocation)、主题-词分布

分类号：TP31(计算技术、计算机技术)

资助基金：安徽省自然科学基金资助项目11040606M133

在线出版日期：2014-01-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：133-135

英文信息展示

期刊专题