10.3969/j.issn.1000-3428.2010.12.069
基于SVM区域构造的复杂中文版面分析
针对现有的版面分析算法对参数的敏感性以及弱适用性等缺陷,提出基于SVM区域构造的复杂中文文档版面分析算法.该算法通过选取最能代表区域字符特征的连通区(种子连通区)作为测试的第一特征,利用具有强学习和泛化能力的支持向量机实现区域构造,在构造的区域中运用投影快速判断文档阅读顺序.实验结果表明,该方法具有更好的适应性,对复杂的中文版面有满意的分析结果.
种子连通区、支持向量机、区域构造、投影
36
TN911.73
国家自然科学基金资助项目60873116;教育部科研基金资助重点项目205059;江苏省高校自然科学基金资助项目07KJD520186
2010-08-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
200-203