10.3969/j.issn.1003-0077.2018.06.008
基于卷积神经网络的缅甸语分词方法
音节是缅甸语的最小构词单位.当前主流的基于统计的分词方法效果严重依赖于预先标注的训练样本集规模及人工方式选取特征的质量,然而,缅甸语属于稀缺资源语言,分词语料标注及特征选取面临较大困难.该文提出一种基于卷积神经网络的缅甸语分词方法,首先将缅甸语音节结构特征应用于缅甸语音节词向量特征分布式表示,然后基于卷积神经网络将音节及其上下文的特征进行融合,得到有效的特征表示,并通过深层网络的逐层特征优化自动学习到缅甸语分词的有效特征向量,最后利用softmax分类器来对构成缅甸语词汇的音节序列标记进行预测.实验结果表明,该方法取得了较好的效果.
分词、缅甸语、卷积神经网络、巴克斯范式、词向量
32
国家自然科学基金61662041;云南省自然科学基金2016FB101;云南省教育厅基金2015Z022;昆明理工大学引进人才科研启动基金KKSY201503007
2018-08-15(万方平台首次上网日期,不代表论文的发表时间)
共10页
62-70,79