10.3969/j.issn.1003-0077.2010.05.005
基于条件随机场的蒙古语词切分研究
词干和构形附加成分是蒙古语词的组成成分,在构形附加成分中包含着数、格、体、时等大量语法信息.利用这些语法信息有助于使用计算机对蒙古语进行有效处理.蒙古语词在结构上表现为一个整体,为了利用其中的语法信息需要识别出词干和各构形附加成分.通过分析蒙古语词的构形特点,提出一种有效的蒙古语词标注方法,并基于条件随机场模型构建了一个实用的蒙古语词切分系统.实验表明该系统的词切分准确率比现有蒙古语词切分系统的准确率有较大提高,达到了0.992.
蒙古语、词切分、词干、构形附加成分、条件随机场、统计语言模型
24
TP391(计算技术、计算机技术)
973前期研究项目资助2007CB316503
2010-11-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
31-35,84