基于条件随机域CRF模型的文本信息抽取
为了抽取文本中的信息,在分析对比了4种统计建模原型后,选用条件随机域CRF建立抽取模型,提出了一种文本信息抽取的方法.该方法对文本分析后加标注,确定文本特征集,采用有限内存拟牛顿迭代方法L-BFGS算法估计CRF模型参数,根据训练学习得出的模型,实现科研论文数据集头部文本信息的抽取.实验结果表明,使用CRF模型的抽取准确率达到90%以上,远远高于使用HMM模型的抽取准确率.
条件随机域、文本信息抽取、参数估计、L-BFGS迭代法、特征集
29
TP391(计算技术、计算机技术)
2009-02-06(万方平台首次上网日期,不代表论文的发表时间)
共4页
6094-6097