10.19678/j.issn.1000-3428.0055363
融合CRF与规则的老挝语军事领域命名实体识别方法
针对老挝语军事领域命名实体识别存在的规则制定不准确、覆盖不全等问题,提出一种融合条件随机场与规则的识别方法.通过分析老挝语语言和领域文本特点,选取词、词性、通名、指界词和词典等原子特征构建组合特征模板,在自建标注语料上训练条件随机场模型,并利用测试语料进行测试.为识别错例,加入能够表达语言确定性的规则进行后处理,以提升识别性能.实验结果表明,该方法总体准确率、召回率和F测度值分别达到91.49%、90.96%和91.22%,可有效提高老挝语军事领域命名实体识别效果.
命名实体识别、军事领域、老挝语、条件随机场、信息抽取
46
TP391(计算技术、计算机技术)
国家自然科学基金;密码科学技术国家重点实验室开放课题;国防科技创新特区项目
2020-09-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
297-304