10.13705/j.issn.1671-6841.2022210
多尺度融合卷积的轻量化Transformer无人机地物识别模型
Transformer模型性能优越,但其巨大的参数量不适合资源受限的无人机遥感任务.为此,提出一种用于无人机遥感图像的多尺度融合卷积的轻量化 Transformer模型,通过设计三种优化策略来提高精度以及减少参数量.首先,设计了一种轻量级多尺度融合卷积方法,补充 Transformer丢失的块内空间信息,从而有效提取多尺度上的粗、细粒度特征表示.其次,设计了多尺度缩减键值序列的方式,优化 Transformer中的自注意力计算.最后,设计了轻量级的 MLP 解码器,进一步减少模型参数量.在 Vaihingen和 Potsdam数据集上与一些主流模型进行了对比实验,结果表明,所提模型的F1 值和交并比均有所提升.同时,在Potsdam数据集上准确度提升 0.29%,参数量比双分支网络 STransFuse减少 18%.
无人机遥感影像、Transformer、语义分割、轻量级、多尺度、卷积神经网络
56
TP183(自动化基础理论)
国家自然科学基金;四川省自然科学基金;国家重点实验室开放基金
2023-12-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
32-39