10.3969/j.issn.1003-3114.2023.03.021
基于Swin-Transformer的YOLOX交通标志检测
交通标志检测是驾驶辅助系统和自动驾驶系统的关键因素之一.在交通标志检测过程中,交通标志距离不同导致目标尺度变化很大,远距离小尺度交通标志对基于卷积网络的目标检测器提出了巨大挑战.YOLOX-Swin 算法将Swin-Transformer作为YOLOX的骨干网络以提取交通标志图像特征,通过移动窗口获取足够的全局上下文信息,并利用多头自注意力机制提取更多差异化特征;利用YOLOX自身的路径增强特征金字塔网络(Path Aggregation Feature Pyramid Network,PAFPN)提取、融合包括交通标志低层信息在内的多尺度特征信息,提升小目标交通标志检测精度.由于小目标交通标志在图像中所占像素较少,同时考虑到Transformer需要的训练样本多于卷积网络,在原本的复制粘贴法上进行改进,增加交通标志样本数量,以进一步提高交通标志检测精度.在 TT100K 数据集上的测试结果表明,所提目标检测方法较其他几种方法具有更高的交通标志检测精度,能满足交通标志检测准确性和实时性要求.
深度学习、YOLOX、Swin-Transformer、小目标检测、复制粘贴法
49
TP391.4(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;浙江省杰出青年基金
2023-06-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
547-555