10.3969/j.issn.1003-0077.2017.06.016
基于分写增强字符向量和LSTM-CRF的朝鲜语自动分写方法
朝鲜语自动分写问题类似于中文分词问题,属于朝鲜语自然语言处理中的基本问题.首先,针对传统的朝鲜语自动分写方法中依赖人工特征的问题,该文提出一种朝鲜语分写增强字符向量训练模型KWSE,用于获取包含语义及分写倾向性信息的字符向量.其次,将朝鲜语分写增强字符向量与LSTM-CRF模型结合,完成朝鲜语自动分写任务.实验结果表明该方法的单词级分写F1值为92.86%,优于其他方法.
朝鲜语、自动分写、分写增强字符向量、LSTM-CRF
31
TP391(计算技术、计算机技术)
吉林省教育厅重点项目吉教科合字[2016]第250号
2018-06-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
119-124