10.3969/j.issn.1005-8214.2015.11.016
基于GATE的楚辞语义标注研究
由于适用性、性能等方面的问题,现有古汉语识别算法无法满足半自动构建楚辞语料库的要求.本文结合程序处理与传统文献研究方法,制作具有语义特征的楚辞词表.利用开源平台设计满足楚辞行文语法的规则,准确标注楚辞文档.通过选取不同题材的楚辞进行测试,调整词表、规则的适用性,提高计算机在楚辞语料库建设中的参与度,同时也提出一种先秦文献处理的新思路.
楚辞、JAPE、GAT、语义标注
G254.29(图书馆学、图书馆事业)
国家社科基金项目"楚辞文献语义化研究"13010077;国家社科基金重大项目"东亚楚辞文献的挖掘、整理与研究" 项目13
2016-01-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
58-62,101