基于N-gram模型的哈萨克词干提取方法
哈萨克语是组成结构复杂的黏着性语言,哈萨克语词干提取词缀提取对哈萨克语信息处理领域具有很重要的意义.从哈萨克语粘着性特点出发,哈萨克语词干词缀的构成规则而且和统计模型特点结合,以N-gram语言模型为主框架,根据哈萨克语的构词约束条件,提出了N-gram语言模型的哈萨克词干提取模型.实验结果表明,N-gram语言模型对哈萨克词干的准确提取是有效的,该模型的词干级准确率达到了72.34%.
哈萨克语、形态、词干提取、N-gram模型、词缀
13
TP391(计算技术、计算机技术)
国家自然科学基金项目61562081
2017-06-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
160-162