10.3969/j.issn.1009-8518.2023.04.009
特征增强的多尺度视觉转换器在遥感图像场景分类中的应用
传统的基于卷积神经网络的卫星遥感图像场景分类方法忽略了场景图像的全局语义特征以及遥感图像在多个尺度上的鉴别特征.针对此问题,文章在视觉转换器和多尺度特征的基础上,提出了一种基于特征增强型多尺度视觉转换器的遥感图像场景分类方法.该方法采用双分支结构在 2 个尺度上对遥感图像进行分块,获取到不同大小的图像块,首先利用位置编码和转换器分别对 2 个尺度下的图像块进行特征学习,再利用通道注意力机制对转换器输出的图像块进行特征增强,最后将 2 个尺度上学习出的分类标记和增强后的特征进行融合决策,从而实现遥感图像场景分类.采用国际公开的光学遥感图像数据集AID和NWPU-RESISC45 进行实验验证,结果表明该方法在AID数据集的场景分类准确率达到(95.27±0.39)%,在NWPU-RESISC45 数据集的场景分类准确率达到(92.50±0.14)%,其分类性能优于CaffeNet、VGG、GoogLeNet和ViT等基准方法.该研究成果提升了模型对全局语义和多尺度特征的感知能力,对于提升卫星遥感图像场景分类技术在土地监测、城市规划等方面的应用具有重要意义.
遥感图像、场景分类、深度学习、视觉转换器、多尺度特征、通道注意力
44
V445(航天仪表、航天器设备、航天器制导与控制)
2023-09-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
79-87