10.3969/j.issn.1673-629X.2008.05.004
一种基于合并策略的机构名称切分方法
在就业招聘信息搜索系统中,如何正确切分机构名是一个非常重要的问题.在对机构名的组成结构进行了深入研究的基础上,提出了机构名的构成规则,建立了用于机构名切分的专有词典,并定制了一个基于合并策略的未登录词识别方法.本系统与海量分词系统进行了对比实验,实验表明,针对机构名切分这个特定领域,文中系统有更好的切分性能.在封闭测试中未登录词识别的准确率可以达到97.26%,召回率可达96.77%.
中文分词、机构名切分、1-最短路径算法、未登录词识别
18
TP391.12(计算技术、计算机技术)
2008-07-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
12-14,18