10.3969/j.issn.1003-0077.2008.03.015
基于最小编辑距离的维语词语检错与纠错研究
拼写错误的发现和候选词选取是文本分析中的一个重要的技术问题.本文结合维吾尔语的语音和词语结构特点,列出了文本中常见的拼写错误类型,详细分析了解决方法,利用最小编辑距离(minimum edit distance)算法实现了维吾尔语文本拼写错误分析中的查错和纠错功能,并以此为基础,结合维吾尔语构词规则,进一步提高了建议候选词的准确率和速度.该算法已被成功地应用到了维吾尔语文字自动校对和多文种文本检索等领域中.在以新疆高校学报为语料的测试中,词语查纠率达到85%以上.
计算机应用、中文信息处理、维吾尔语、词法分析、纠错、最小编辑距离
22
TP391(计算技术、计算机技术)
国家自然科学基金60662002;新疆高等学校科研项目XJEDU2005S02
2008-07-01(万方平台首次上网日期,不代表论文的发表时间)
共5页
110-114