10.3969/j.issn.1003-0077.2012.02.003
一种利用注疏的《左传》分词新方法
先秦文献的注疏文献中包含有大量词汇语义知识,是先秦文献自动分词的重要依据.该文以篇幅最大的先秦文献《左传》为研究对象,在对《左传》及其注疏文献进行自动对齐的基础上,提出了一种利用注疏的《左传》分词新方法.分词实验的F值达到89.0%,较之baseline有明显提升.该方法无需训练语料,利用注疏文献辅助分词的思想也适合推广到其他先秦文献的自动分词任务中去.
先秦文献、注疏文献、自动对齐、自动分词
26
TP391(计算技术、计算机技术)
国家“211工程”三期重点学科建设项目“语言科技创新及工作平台建设”子课题“先秦文献词汇统计与知识检索系统”;江苏高校哲学社会科学重点研究基地重大项目“先秦文献词汇知识挖掘”2010JDXM023
2012-05-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
13-17,45