10.3778/j.issn.1002-8331.1911-0032
基于YOLO的自然场景倾斜文本定位方法研究
为了提升倾斜文本区域定位的准确度,提出了一种基于YOLO算法改进的YOLO_BOX定位模型.设置不同尺寸的anchor对图片进行训练,且定义LOSS损失函数训练预测模型;使用K-means算法对box进行聚类,并利用NMS方法进行多余候选框过滤;利用Angle Correct算法对聚类后的box进行灰度化处理,通过计算像素灰度值的方差来得到文字的倾斜角度并进行角度矫正.实验结果表明,优化后的YOLO_BOX定位模型在ICDAR2015数据集上,对自然场景中倾斜文本区域的定位中具有较高的准确率和召回率.
深度学习、卷积神经网络、目标检测、倾斜文本定位、聚类
56
TP311(计算技术、计算机技术)
国家自然科学基金青年项目;山东省自然科学基金博士基金;山东省高等学校科技计划;教育部产学合作协同育人项目
2020-05-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
213-220