DOI：10.3969/j.issn.1000-0135.2008.01.006

中文自动问答中句子相似度计算研究

引用

摘要：

句子相似度计算是自动问答系统的重要理论基础和关键实现技术.目前,用于中文自动问答系统的句子相似度计算方法很多,由于缺乏系统的分析,给研究人员带来了较大的不便.依据所利用的特征信息,可以将这些方法分为四类,即基于关键词信息、基于语义信息、基于句法结构信息以及基于多重信息.通过对各类方法实验结果的比较,指出各自的优势和不足.同时指出,基于多重信息的方法是当前的主流方法,实现不同特征信息的最佳权重分配是该类方法今后的研究重点.另外,还提出一个有关相似度概念认识上的看法,即对于中文自动问答系统,实质上依据的是句子的相关度,而不是句子的相似度.通过本文的研究,旨在为中文自动问答领域的句子相似度计算研究提供一定的参考.

关键词：自然语言处理、中文自动问答、句子相似度

所属期刊栏目：27

分类号：G35(情报学、情报工作)

资助基金：安徽省高校省级自然科学基金KJ2007B245

在线出版日期：2008-03-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：35-41

英文信息展示

期刊专题