基于结合词典的CNN-BiGRU-CRF网络中文分词研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.14022/j.issn1674-6236.2021.16.014

基于结合词典的CNN-BiGRU-CRF网络中文分词研究

引用
针对现有的基于神经网络中文分词模型,通常需要大量的标注句来进行模型训练,不能充分利用汉语词典中的有用信息等问题,文中提出了将基于伪标记数据生成和基于多任务学习的两种方法融合来利用字典信息,将字典信息加入到CNN-BiGRU-CRF模型中进行训练,通过在两个基准数据集PKU和MSRA上进行验证,其准确率分别达到97.6%和97.8%,实验结果验证了该方法可以有效地提高中文分词的性能.

中文分词;字典信息;伪标记数据生成;多任务学习;序列标注

29

TP391(计算技术、计算机技术)

太原理工大学科技创新基金资助9002-03011843

2021-08-23(万方平台首次上网日期,不代表论文的发表时间)

共7页

64-69,74

相关文献
评论
暂无封面信息
查看本期封面目录

电子设计工程

1674-6236

61-1477/TN

29

2021,29(16)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn