10.3969/j.issn.1003-0077.2012.02.001
异种语料融合方法:基于统计的中文词法分析应用
基于统计的中文词法分析往往依赖大规模标注语料,语料的规模和质量直接影响词法分析系统的性能.高覆盖率、高质量的语料资源非常有限,而且适用于不同领域的语料往往具有不同的分词和词性标注标准,难以直接混合使用,从而导致既有资源未能充分利用,分词精度下降等问题.针对该问题,该文提出了简单有效的异种语料的自动融合方法,并通过实验验证了提案方法的有效性、较强的实用性以及对多种语料融合的可扩展性.
词法分析、语料融合、领域适应
26
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60873167,60736014;中央高校基本科研业务费专项资金项目2009JBM027
2012-05-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
3-7,12