10.3772/j.issn.1000-0135.2009.03.020
藏族人名汉译名识别研究
藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,字(串)特征和内部构成复杂;其次,藏族人名中含有大量高频单字,使得藏族人名和普通词语之间歧义冲突变得十分突出,同时也使得藏族人名和上下文之间的边界变得非常模糊.本文在大规模藏族人名实例和语料库调查基础上,统计分析了藏族人名的用字(串)特征,并构建了藏族人名属性特征库;通过藏族人名的命名规则及属性特征将藏族人名形式化表示,实现了藏族人名汉译名自动识别系统.真实语料库开放测试F值达到87.12%.
藏族人名识别、未登录词、可信度、自动分词
28
TP3;H21
国家自然科学基金60572159;教育部科学技术研究重点项目107017
2009-06-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
475-480