10.3969/j.issn.1003-0077.2012.03.011
基于“固结词串”实例的中文分词研究
近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注.但是这种分词方法在处理歧义切分方面存在一定的问题.CRF虽然可以消除大部分原有的分词歧义,却会带来更多新的错误切分.该文尝试找到一种简单的、基于“固结词串”实例的机器学习方法解决分词歧义问题.实验结果表明,该方法可以简单有效的解决原有的分词歧义问题,并且不会产生更多新的歧义切分.
中文分词、CRF、固结词串、分词歧义、机器学习
26
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60872121
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
59-64