10.3969/j.issn.1000-7024.2014.11.062
维-汉统计机器翻译中维吾尔语预处理研究
为有效降低维-汉统计机器翻译中语料质量对翻译质量的影响,对维吾尔语文本预处理技术进行研究,结合维吾尔语文本语料的语言特征和多样性,提出基于语法规则和词法规则结合的维吾尔语文本预处理方法.在对维吾尔语文本中的语义单元、对偶词和标点符号进行特征分析的基础上,导出维吾尔语文本词例化和标点符号规范化的规则和处理流程.实验结果表明,该研究有效降低了词对齐阶段的单词数量、缓解了数据稀疏,提高了翻译质量.
维汉机器翻译、维吾尔语、单词、词例化、标点符号
35
TP391(计算技术、计算机技术)
中国科学院战略性先导科技专项基金项目XDA06030400;中国科学院“西部之光”人才培养计划基金项目XBBS201216;新疆维吾尔自治区青年科技创新人才培养工程基金项目2013731021
2015-01-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
4034-4039