10.3969/j.issn.1000-1220.2018.11.018
弱标注环境下基于CNN的汉语句群自动切分
句群在汉语语篇中占据重要的地位,实现句群的自动切分可以有效地提升机器翻译以及机器阅读理解的准确率.为了实现汉语句群的自动切分,本文利用卷积神经网络以及注意力机制对语篇句对进行分类,并结合句群主题特征来提升句群边界识别的准确率,利用大规模弱标注段落数据集解决句群语料短缺的难题.数据表明,该方法能够有效地进行句群边界的自动识别,实现句群的自动切分.
弱标注、卷积神经网络、句群切分、句群主题
39
TP391(计算技术、计算机技术)
国家重点基础研究发展基金项目2013CB329304;国家自然科学基金项目61433018,61373075,61411130162,61671070;北京成像技术高精尖创新中心项目BAICIT-2016003;国家社会科学基金重大项目15ZDB017;国家语委重点项目ZDI135-53
2018-12-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
2441-2446