10.3969/j.issn.1002-137X.2013.02.027
采用半随机特征采样算法的中文书写纹识别研究
N-gram字符序列能有效捕捉文本中作者的个体风格信息,但其特征空间稀疏度高,且存在较多噪音特征.针对该问题,提出一种基于半随机特征采样的中文书写纹识别算法.该算法首先采用一种离散度准则为每个作者选取一定粒度的个体特征集,然后将个体特征集以一种半随机选择机制划分成多个等维度的特征子空间,并基于每个子空间训练相应的基分类器,最后采取多数投票法的融合策略构造集成分类模型.在中文真实数据集上与基于随机子空间和Bagging算法的集成分类器进行了对比试验,结果表明,该算法在正确率和差异度方面优于随机子空间和Bag-ging算法,并且取得了比单分类模型更好的识别性能.
书写纹、半随机特征采样、个体特征集、集成分类器、差异度
40
TP391(计算技术、计算机技术)
国家"核高基"重大专项基金项目2010ZX01045-001-005;国家"十二五"科技支撑计划项目2011BAK08B03;广东省教育部产学研结合示范基地项目2011B090500017;教育部-英特尔信息技术专项科研基金项目MOE-INTEL-11-02
2013-03-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
120-123,152