单块嵌入式GPU下对街景图像的实时分割研究
在有限的计算资源下,现有的语义分割网络无法兼顾实时性和准确性,导致在自动驾驶等实时应用领域上仍无法落地应用.为此,本研究采用先将感兴趣目标定位正确后再做进一步分类的策略,其在不同深度下部署了轻量级注意力机制模块以快速地捕捉到有效的空间特征信息,紧接着特征融合模块能够融合这些兼容性低下的空间特征信息,最后经过边界与内部优化模块以提高分割目标边界的平滑性以及内部的准确性和连续性.实验证明单块Tesla-P100显卡搭载所提出的网络能够胜任大部分实时任务.对于352×480分辨率的Camvid图像输入,网络在76.69帧下仍能达到69.12%的均交并比;对于1024×2048分辨率的Cityscapes图像输入,网络在49.90帧下均交并比达到了79.75%;对于720×1280分辨率的Aeroscapes图像输入,网络在59.53帧下均交并比达到了80.43%.
语义分割;自动驾驶;轻量级注意力机制;特征融合;边界与内部优化;帧;均交并比
28
TP391(计算技术、计算机技术)
国家自然科学基金61703277
2021-12-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
2165-2173