10.3969/j.issn.1000-3428.2007.10.006
基于CRF的百科全书文本段落划分
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注.该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法更好的结果.
文本段落划分、条件随机域模型、隐马尔科夫模型
33
TP18(自动化基础理论)
国家自然科学基金60272055;国家高技术研究发展计划863计划2001AA110372-1
2007-06-25(万方平台首次上网日期,不代表论文的发表时间)
共3页
16-18