基于词缀的维吾尔谚语识别关键技术研究
在自然语言理解、机器翻译、舆情分析等自然语言处理领域中,维吾尔谚语识别是整个文本实体识别的重要组成部分.为满足维吾尔谚语信息化的需求,本文构建了比较完善的维吾尔谚语语料库.同时,从传统语言学角度对维吾尔谚语的语法、语义结构进行分析,构建了一个由维吾尔谚语功能语类(词缀)组成的、专属维吾尔谚语规则的知识库,并将此知识库与自然语言处理技术相结合,实现一个既能够从文本中识别出维吾尔谚语,又能提供维汉互译等功能的信息软件系统.该系统也为开展计算机理解与处理维吾尔文字奠定了一个崭新的基础.
维吾尔谚语、谚语词缀、谚语规则、词缀覆盖率、谚语规则库、谚语语料库、识别系统
13
TP391.1(计算技术、计算机技术)
新疆维吾尔自治区重点实验室开放课题2015KL031;新疆维吾尔自治区重大科技专项课题2016A03007-3;新疆维吾尔自治区自然科学基金项目2015211B034;中科院战略性先导科技专项项目XDA06030400;新疆维吾尔自治区社会科学基金项目2016CYY067
2018-06-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
452-457