10.3969/j.issn.1003-3254.2010.01.002
AnswerSeeker:基于互联网挖掘的智能问答系统
智能问答系统是一种处理自然语言的新型的信息检索系统.介绍了AnswerSeeker智能问答系统.该系统采用了模块化和可扩展的框架,以便整合多种智能问答技术和多样化数据源.通过将与语言无关的代码和语言相关的代码分离,并且将语言相关的代码封装为组件,只要替换相应的组件,该系统可以适用于多种语言.由于很多自然语言处理技术还没有针对中文的,目前为止,我们系统的内核只支持英文,所以将以英语自然语言为例介绍AnswerSeeker的架构和工作原理.该系统采用了两种互联网挖掘的方法来寻找问题的答案:知识挖掘和知识诠释.AnswerSeeker使用网络作为一个知识源.当然它也可以使用其他小的语料库或面向专业领域的知识库作为知识源.此外,提出了一种新的问题的表示和答案提取的方法一文本模式,文本模式分为问题模式和答案模式;其中问题模式用来表示问题,答案模式用来提取精确的答案.AnswerSeeker通过将问题一答案对作为训练数据,自动学习答案模式.实验表明将互联网作为知识源,将模式学习和知识诠释的技术集成在同一系统中进行答案挖掘是一种这种很有前途的方法.
互联网挖掘、知识挖掘、知识诠释、模式学习、智能问答
19
TP3;TP1
北京市大学生科学研究和创业行动计划0832
2010-03-29(万方平台首次上网日期,不代表论文的发表时间)
共12页
6-17