10.3969/j.issn.1003-0077.2020.09.003
精细化的中文词性标注评测集的研制
该文提出了一套精细化的中文词性标注评测体系.该文的工作重点在于确立其中的评测项目以及每个项目所对应的词例,提出了比对、归类、合取的方法;依此,该文初步建立了规模为5873句、涵盖了2326项词例和70个评测项目的评测试题集,并用这套试题集对几个常见的开源词性标注程序进行了评测.最后,该文指出了精细化评测体系将评测项目和评测语料联系起来的好处——在传统体系中,两者是分开的.该文从评测项目的价值和评测语料的组织性两个方面阐述了该文的评测体系相对于传统评测体系的优势,并指出了利用该文提出的评测体系改进被测程序的方法.
精细化评测、词性标注、语言资源
34
TP391(计算技术、计算机技术)
教育部人文社科重点研究基地重大项目;国家自然科学基金
2020-11-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
9-18