10.3969/j.issn.1003-0077.2012.04.005
古汉语双字词自动获取方法的比较与分析
词汇的自动获取在自然语言生成、计算词典编纂、句法分析以及语料库语言学等领域均有着重要的研究价值.该文针对古汉语双字词的自动获取问题,以《史记》全文语料为例,分别应用基于频率、互信息、假设检验的统计方法获取古汉语双字词,并结合人工标注结果进行了详细的比较和分析,评价了各方法的优缺点及可靠性,为不同应用背景下的古汉语双字词自动获取提供了相应的解决方案.
中文信息处理、古汉语、史记、双字词、统计模型
26
TP391(计算技术、计算机技术)
2012-11-01(万方平台首次上网日期,不代表论文的发表时间)
共9页
34-42