中文篇章零元素语料库构建
针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作.首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性.然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC 语料库的构建.最后, 对该语料库进行一系列详细的统计分析.结果表明, CDZC 能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持.
中文零元素、篇章视角、语料库构建、中文篇章零元素语料库
55
国家自然科学基金61472264, 61751206;国家重点研发计划2017YFB1002101
2019-08-30(万方平台首次上网日期,不代表论文的发表时间)
共7页
15-21