10.3969/j.issn.1000-582X.2005.09.014
基于词性信息的汉语时间语词消歧算法
切分歧义是影响汉语自动分词系统精度的一个重要因素.时间语词包括指明事件发生确定时间位置的时点时间词和指明动作或状态持续一段时间的时段时间词.基于现代汉语语料库加工规范,特定类型的时间语词存在切分歧义及考察时间语词的语用,提出了基于时间语词上下文词性信息的统计语言模型和基于极大似然原理的消解这类歧义的算法,其开放测试正确率约为90%.
自然语言处理、切分歧义、时间语词、词性信息、统计语言模型
28
TP391(计算技术、计算机技术)
国家自然科学基金60173060
2005-11-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
53-56