DOI：10.3969/j.issn.1003-0077.2012.04.005

古汉语双字词自动获取方法的比较与分析

引用

摘要：

词汇的自动获取在自然语言生成、计算词典编纂、句法分析以及语料库语言学等领域均有着重要的研究价值.该文针对古汉语双字词的自动获取问题,以《史记》全文语料为例,分别应用基于频率、互信息、假设检验的统计方法获取古汉语双字词,并结合人工标注结果进行了详细的比较和分析,评价了各方法的优缺点及可靠性,为不同应用背景下的古汉语双字词自动获取提供了相应的解决方案.

关键词：中文信息处理、古汉语、史记、双字词、统计模型

所属期刊栏目：26

分类号：TP391(计算技术、计算机技术)

在线出版日期：2012-11-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：34-42

英文信息展示

期刊专题