Web文本中维吾尔语领域术语的自动发现
针对维吾尔语领域术语获取难度大,人工扩充领域术语工作量大、效率低等特点,利用词汇共现原理,以维吾尔语连接词和互信息(MI)为工具,快速扩充原始维吾尔语领域术语;建立了以维吾尔语领域术语为特征模板,利用条件随机场(CRF)模型实现Web文本中维吾尔语领域术语的自动发现方法,并在此基础上实现长维吾尔语领域术语的自动发现.实验表明,对短维吾尔语领域术语的自动发现准确率为97.59%,召回率为93.38%,对长维吾尔语领域术语的自动发现正确率达到55.72%.
维吾尔语、互信息、条件随机场、TF/IDF
32
TP181(自动化基础理论)
国家自然科学基金资助项目60963017;国家社科基金资助项目10BTQ045,11XTQ007
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
407-410