10.3969/j.issn.1001-3695.2007.04.031
基于类向量模型的中文姓名识别研究
提出了一种基于类向量模型的中文姓名识别方法.该方法通过类向量的生成来模拟人工识别姓名的过程,采用Viterbi算法对未经切分的汉字串进行类向量标注得到类向量序列,通过检查相邻类向量中类别和向量分量的变化来最终识别出人名.该方法是完全数据驱动的,不需要姓名识别的模式和规则.通过对互联网上随机抽取的1 000篇文章进行测试,结果表明,中文姓名识别召回率为82.2%,准确率为70.3%.
中文姓名识别、类向量模型、Viterbi算法、基于汉字
24
TP391(计算技术、计算机技术)
2007-05-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
111-113