10.16652/j.issn.1004-373x.2020.19.029
融合多特征的老挝机构名实体识别方法
为了解决老挝机构名实体构词方法和语法规则复杂的问题,提出融合多特征的CRF与SVM的实体识别框架.面向老挝语机构名构词特点,将老挝机构名称分为前缀词和后缀词,将前缀词提取构造成一个机构名称特征词典,基于词典与SVM模型确定老挝机构名称前界,再使用融合多特征的CRF模型识别机构名称;最后使用SVM确定的前缀词修正CRF的识别结果.实验结果表明,精确率达到83.49%,召回率达到81.99%,证明了该方法的有效性.文中方法结合了SVM模型与CRF模型的优点,并融合了老挝机构名称的相关语言学特征,取得了较好的识别效果.
老挝语、机构名称识别、多特征融合、前缀词提取、识别结果修正、实验结果分析
43
TN911.1-34;TP391
国家自然科学基金;国家自然科学基金;云南省自然科学基金面上项目
2020-10-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
122-125,129