DOI：10.3969/j.issn.1001-3695.2007.04.031

基于类向量模型的中文姓名识别研究

引用

摘要：

提出了一种基于类向量模型的中文姓名识别方法.该方法通过类向量的生成来模拟人工识别姓名的过程,采用Viterbi算法对未经切分的汉字串进行类向量标注得到类向量序列,通过检查相邻类向量中类别和向量分量的变化来最终识别出人名.该方法是完全数据驱动的,不需要姓名识别的模式和规则.通过对互联网上随机抽取的1 000篇文章进行测试,结果表明,中文姓名识别召回率为82.2%,准确率为70.3%.

关键词：中文姓名识别、类向量模型、Viterbi算法、基于汉字

所属期刊栏目：24

分类号：TP391(计算技术、计算机技术)

在线出版日期：2007-05-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：111-113

英文信息展示

期刊专题