置信度加权在线序列标注算法
序列标注问题是自然语言处理领域的基本问题之一.序列标注任务是将连续输入的不定长序列,标注成连续等长的标签序列.在在线序列标注方法的基本框架下,针对序列标注任务的特征稀疏特性,采用置信度加权分类算法思想,提出了一种新的线性判别式在线序列标注方法-置信度加权在线序列标注算法.该方法对每个特征权值参数引入一个概率置信度,取得了优于其他相关算法的性能.在中文分词,中文名实体识别以及英文组块分析等问题上,验证了本文方法的有效性.
序列标注问题、自然语言处理、在线序列标注算法、置信度加权、概率置信度
37
TP391.1(计算技术、计算机技术)
国家高技术研究发展计划863计划项目2006AA01Z197;国家自然科学基金60703015;60973076
2011-08-10(万方平台首次上网日期,不代表论文的发表时间)
188-195