10.3969/j.issn.1673-629X.2015.02.040
中文分词与词性标注研究
分词和词性标注是中文语言处理的重要技术,广泛应用于语义理解、机器翻译、信息检索等领域。在搜集整理当前分词和词性标注研究与应用成果的基础上,对中文分词和词性标注的基本方法进行了分类和探讨。首先在分词方面,对基于词典的和基于统计的方法进行了详细介绍,并且列了三届分词竞赛的结果;其次在词性标注方面,分别对基于规则的方法和基于统计的方法进行了阐述;接下来介绍了中文分词和词性标注一体化模型相关方法。此外还分析了各种分词和词性标注方法的优点和不足,在此基础上,为中文分词和词性标注的进一步发展提供了建议。
中文分词、主动学习、词性标注、自然语言处理、一体化模型
TP311(计算技术、计算机技术)
国家自然科学基金资助项目61302157;教育部人文社会科学研究青年基金12YJC870008;江苏省教育高校哲学社会科学基金2013SJB870004;江苏省社科研究文化精品课题12SWC-030
2015-03-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
175-180