对零回指缩略语的识别与还原技术初探
缩略语在汉语中的高频使用,使得缩略语的识别成为中文信息处理不可回避的问题.利用规则对初分词后形成的散串进行缩略语的识别,然后利用缩略语相对稳定的抽取规律这一特性,通过统计生成缩略语字对应原语言词的词典,利用匹配概率和共现概率进行缩略语对应原语言的还原.在实验中,经封闭测试,缩略语的识别正确率为93.0%,召回率为94.3%,缩略语的还原正确率为72.3%.
缩略语、原语言、零回指、共现概率、匹配概率
30
TP39(计算技术、计算机技术)
国家自然科学基金项目60473139、60775041
2009-04-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
1239-1241,1266