10.3969/j.issn.1673-629X.2015.09.009
基于规则的哈萨克语句法分析算法研究
哈萨克语的理解一般分为以下步骤:原文输入、词语切分及词语属性特征标注、语法及句法分析、语义及语用和语境分析、生成目标形式表示、句群及篇章理解等。句子分析上接篇章理解,下联词汇分析,起着承上启下的作用。由于哈萨克语句法分析结果的准确度将对后续机器翻译的研究产生影响,在掌握哈萨克语词法分析技术的基础上,结合现代哈萨克语句法结构特点,首先介绍了厄尔利算法、GLR算法和线图算法三种基于规则的句法分析算法。通过实验对比发现,线图分析算法在哈萨克语简单句的分析中具有运算速度快和占用空间小的综合优势。针对传统线图分析算法冗余边较多造成分析准确率不高的现象引入规则库优化的改进线图算法,实验结果表明,改进后的线图算法使得准确率提高了4.19%,运行时间缩短了20倍。
哈萨克语、句法分析、线图分析算法、规则库、句法树
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61063025,61363062
2015-10-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
43-47