一种基于无监督学习的交集型歧义处理改进方法
歧义处理是中文分词的难点之一,其中交集型歧义占该类问题的主要部分,而无监督学习可以利用互联网上的无标注语料库来处理该问题.文章将比较卡方统计量、t-测试差在歧义处理中的效果,通过对其研究提出一种改善歧义处理性能的方法.实验结果表明,所提出的方法能有效进行分词,并提高了交集型歧义消解的性能.
分词、无监督学习、交集型歧义
35
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61262071;云南省应用基础研究计划青年资助项目2013FD015
2015-12-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
45-49