10.20091/j.cnki.1000-3177.2024.03.017
基于CNN与ViT混合结构的遥感图像地物分类算法
针对传统的基于机器学习和卷积神经网络等遥感图像分类方法整体分类精度不高以及受限于局部感受野造成的全局特征提取不足等现象,为进一步提高遥感图像的分类精度,提出了一种结合三维、二维卷积核混合的神经网络(three dimensional and two dimensional convolutional neural network,3D-2D CNN)与视觉transformer(vision transformer,ViT)的遥感图像分类方法Hybrid CNN-ViT.算法在3D和2D卷积核充分提取遥感图像空间光谱信息的基础上,通过ViT的多头注意力机制提取全局序列信息,解决全局特征提取不足的问题.实验将影像划分不同比例的训练集、验证集与测试集,并与DBDA、DBMA和3D-2D CNN做对比.结果表明,训练集:验证集:测试集为8:1:1时,该方法的分类精度达到最高,总体分类精度(99.47%)、Kappa系数(0.9908)均优于其他3种方法.
卷积神经网络、深度学习、视觉transformer、地物分类、图像处理
39
TP751(遥感技术)
国家自然科学基金;国家自然科学基金
2024-08-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
121-127