10.3969/j.issn.1003-0077.2017.06.015
CRF与规则相结合的维吾尔文地名识别研究
该文通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法.根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、地名特征词、地名词缀等特征进行实验,结果表明这些特征对识别性能有较大的影响.通过对错误识别结果分析,该文提出了基于规则的后处理,进一步提高了识别性能,准确率达到94.68%,召回率达到89.52%,F值达到92.03%.
命名实体、维吾尔文、地名、条件随机场、词向量
31
TP391(计算技术、计算机技术)
国家自然科学基金61462083,61262060,61331011,61463048;国家重点基础研究发展计划9732014CB340506;新疆多语种信息技术实验室开放课题项目2016D03023;"自治区青年科技创新人才培养工程"青年博士项目QN2015BS004
2018-06-01(万方平台首次上网日期,不代表论文的发表时间)
共9页
110-118