汉语语料库词性标注自动校对方法研究
从聚类和分类的角度入手,对大规模语料库中的词性标注的自动校对问题作了分析,提出了语料库词性标注正确性检查和自动校对的新方法.该方法利用聚类和分类的思想,对范例进行聚类并求出阈值,根据阈值,判定词性标注的正误;对标注错误的词性,按靠近各词性类别重心的原则归类,给出一个校对词性,进而提高汉语语料库词性标注的准确率.
聚类、词性标注、自动校对
25
TP391(计算技术、计算机技术)
国家高技术研究发展计划863计划2001AA4031
2005-01-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
17-19,24