10.3321/j.issn:1002-8331.2006.28.049
中文单字国名简称的自动识别
单字地名简称识别是中文专名识别的重要组成部分,其中单字国名简称又占到了78.43%.但就现有的词性标注系统来看,还不能很好地对其进行识别.文章提出了一个基于规则的识别方法,以分词文本为底本,通过两次扫描,第一次扫描建立基于语篇的临时国名词表,第二次扫描利用上下文特征词等评分机制,从分词碎片中召回单字国名简称.在封闭测试和开放测试中,都取得了较好的实验结果,以人工分词文本为输入底本,调和平均值分别达到了96.33%和94.96%.
单字地名、单字国名简称、评分机制、临时词表
42
TP391(计算技术、计算机技术)
国家211工程项目1240702504
2006-11-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
167-169,176