10.3969/j.issn.1003-0077.2004.03.004
基于网络的中文问答系统及信息抽取算法研究
问答系统(Question Answering System)能用准确、简洁的答案回答用户用自然语言提出的问题.目前多数问答系统利用大规模文本作为抽取答案的知识库,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源,对于回答简短、基于事实的问题非常有效.本文对基于网络的问答系统研究现状作了简要的介绍,分析了网络信息的特点.我们提出了一种基于语句相似度计算的答案抽取方法,在此基础上实现了一个基于网络的中文问答系统.该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间.实验结果表明该系统对人名、数量及时间类型的问题效果显著,对测试问题集的MRR值达到0.51.
计算机应用、中文信息处理、问答系统、句子相似度、信息抽取
18
TP391.1(计算技术、计算机技术)
2004-06-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
24-31