10.3778/j.issn.1002-8331.1308-0196
基于感知机模型藏文命名实体识别
藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模型训练特征模板,训练模型,以及命名实体分类识别方法。提出的藏文命名实体识别方法在测试集上获得86.03%的F值,相对基于分词的基线系统高出10.5%个点。
藏文音节、命名实体、藏文命名实体、感知机模型
TP391(计算技术、计算机技术)
国家自然科学基金No.61363055,No.61063033,No.61163018;教育部“春晖计划”合作科研项目No.Z2012102。
2014-08-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
172-176