融合注意力机制的模糊图像多尺度复原

引用

摘要：

目的去模糊任务通常难以进行对图像纹理细节的学习,所复原图像的细节信息不丰富,图像边缘不够清晰,并且需要耗费大量时间.本文通过对图像去模糊方法进行分析,同时结合深度学习和对抗学习的方法,提出一种新型的基于生成对抗网络(generative adversarial network,GAN)的模糊图像多尺度复原方法.方法使用多尺度级联网络结构,采用由粗到细的策略对模糊图像进行复原,增强去模糊图像的纹理细节;同时采用改进的残差卷积结构,在不增加计算量的同时,加入并行空洞卷积模块,增加了感受野,获得更大范围的特征信息;并且加入通道注意力模块,通过对通道之间的相关性进行建模,加强有效特征权重,并抑制无效特征;在损失函数方面,结合感知损失(perceptual loss)以及最小均方差(mean squared error,MSE)损失,保证生成图像和清晰图像内容一致性.结果通过全参考图像质量评价指标峰值信噪比(peak signal to noise ratio,PSNR)、结构相似性(structural similarity,SSIM)以及复原时间来评价算法优劣.与其他方法的对比结果表明,本文方法生成的去模糊图像PSNR指标提升至少3.8％,复原图像的边缘也更加清晰.将去模糊后的图像应用于YOLO-v4(you only look once)目标检测网络,发现去模糊后的图像可以检测到更小的物体,识别物体的数量有所增加,所识别物体的置信度也有一定的提升.结论采用由粗到细的策略对模糊图像进行复原,在残差网络中注入通道注意力模块以及并行空洞卷积模块改进网络的性能,并进一步简化网络结构,有效提升了复原速度.同时,复原图像有着更清晰的边缘和更丰富的细节信息.

关键词：注意力机制、图像修复、深度学习、生成对抗网络(GAN)、多尺度

所属期刊栏目：27

分类号：TP183(自动化基础理论)

资助基金：国家自然科学基金;福建省科技对外合作项目;厦门大学校长基金;民营健康医疗大数据应用福建省高校工程研究中心开放基金项目;厦门理工学院光电与通信工程学院研究生科技创新项目

在线出版日期：2022-05-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共15页

页码：1682-1696

英文信息展示

期刊专题