基于最大熵算法的全文检索研究
全文检索是一种有效的信息检索技术,改进最大熵模型的应用研究在自然语言处理领域中受到关注.笔者利用语料库中词性标注和词频标注的上下文信息,建立基于互信息的最大熵方法的检索系统,研究的重点在于提出一种中文分词算法,并从实际问题出发,采用面向对象和模型驱动的设计方法,将该算法应用于实际的全文检索系统的设计中.
全文检索、最大熵模型、分词
30
TP301.2(计算技术、计算机技术)
河北省科技厅科技攻关项目07213574
2009-07-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
112-115