10.12141/j.issn.1000-565X.210028
基于贪吃蛇算法和部首识别的手写文本切分
针对手写中文文本交错、粘连、字内过分离等问题,提出一种基于贪吃蛇算法和部首识别的文本切分方法.首先,根据贪吃蛇算法建立文本原始切分轨迹,并依据多重规则优化切分路径;之后,基于粘连字符的轮廓和骨架提取候选粘连点,利用贪吃蛇算法进行二次切分;最后,对过切分字符,进行部首的笔段提取和识别,依据汉字结构确定合并方向,并结合几何置信度和识别置信度完成合并,得到最终正确的文本切分结果.以陕西省某高中试卷中1542行手写文本作为实验数据进行了算法验证,结果表明,该算法切分正确率可达到82.15%.
手写体中文文本;粘连字符;贪吃蛇;过切分合并;部首识别;笔段提取
50
TP391.43(计算技术、计算机技术)
国家自然科学基金;北京市自然科学基金资助项目;北京市教委教学改革创新项目
2022-02-25(万方平台首次上网日期,不代表论文的发表时间)
共11页
80-90