10.13413/j.cnki.jdxblxb.2015.05.25
一种基于规则的无监督词性标注方法
提出一种基于规则的无监督词性标注方法,利用200多条英语语法规则,创建26个规则函数,先将输入的待标注英语句子进行预处理后得到初始标记,再对每个单词调用规则函数,最终得到标注后的英语句子.通过对 Brown 语料库的实验,词性标注的正确率达到93.95%.实验结果表明,本文方法可行、有效,能很好地提高英语词性标注的准确率.
词性标注、基于规则、无监督学习、规则函数
TP181(自动化基础理论)
国家自然科学基金71473035;教育部人文社会科学研究项目14YJA870010;吉林省工业技术研究和开发项目JF2012c016-2;吉林省科技重点攻关项目20150204040GX;吉林大学研究生创新基金2015040
2015-10-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
956-962