DOI：10.3969/j.issn.1003-0077.2017.06.007

基于神经网络纠正器的领域分词方法

引用

摘要：

提出了一种基于神经网络的中文分词方法,以提高分词系统向新领域迁移的适应性和灵活性.该文方法采用了对现有分词器分词结果进行纠正的思路.这种基于纠正的两阶段方法与分词模型解耦,避免了对源领域语料和分词器构建方式的依赖.然而现有的基于纠正的方法依赖于特征工程,无法自动适应不同领域.该文利用神经网络对纠正器进行建模,在无需手工设计特征的情况下即可实现领域适应.实验表明,与当前方法相比,该文方法在领域文本上具有更好的分词性能和鲁棒性,尤其在未登录词召回率方面提升显著.

关键词：中文分词、领域适应、神经网络

所属期刊栏目：31

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金61472436,61532001

在线出版日期：2018-06-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：41-49

英文信息展示

期刊专题