10.16208/j.issn1000-7024.2016.04.028
基于稀疏编码直方图的TSM识别场景文本算法
基于部件的树结构模型(TSM)使用的底层特征梯度直方图(HOG)对文字特征表达性不强,且降维时易造成信息丢失.针对该问题,构建以稀疏编码直方图(HSC)为底层特征的基于部件的树结构模型(HSC-TSM)识别场景文本.将K-SVD学习字典用于计算稀疏编码,逐像素地将稀疏编码聚合成HSC,描述文字的局部外观信息;通过奇异值分解对HSC进行降维,避免信息丢失.HSC-TSM在数据集ICDAR 2003上对各类文字的识别率比TSM高3.08%-10.28%,在数据集ICDAR 2003和SVT上的单词识别率分别提升了5.30%和3.62%.
场景文本识别、基于部件的树结构模型、奇异值分解、稀疏编码直方图
37
TP242.62(自动化技术及设备)
2014年国家科技支撑计划基金项目2014BAH30B01
2016-06-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
988-992,1090