10.19678/j.issn.1000-3428.0048667
基于维基百科的中文嵌套命名实体识别语料库自动构建
传统的监督学习方法需要标注一定规模的领域内语料库,限制了其领域适应性.为此,提出一种从中文维基百科条目中自动构建中文嵌套命名实体识别语料库的方法.对中文维基百科的条目进行实体分类,利用实体条目构造实体的嵌套结构,从而自动生成大规模的中文嵌套命名实体识别语料库.在手工标注嵌套命名实体识别语料库上的实验结果表明,自动构建的语料库具有规模较大、领域广的特点,且能够适应宽泛领域上的中文嵌套命名实体识别任务.
嵌套命名实体识别、信息抽取、维基百科、语料库、条件随机场
44
TP311(计算技术、计算机技术)
国家自然科学基金61373096,61331011,61673290
2019-01-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
76-82