10.16652/j.issn.1004-373x.2023.15.007
基于改进锚点框与Transformer架构的目标检测算法
针对目标检测中目标尺度多变以及小目标众多等难点,提出一种融合改进锚点框和Transformer架构的目标检测算法.首先采用K-Means++算法对数据集进行聚类,得到更符合目标实际尺寸的锚点框,提高锚点框匹配的准确性;其次在检测器颈部引入Transformer Encoder结构,利用其长距离依赖属性获取全局信息,弥补CNN计算的不足.所提算法在PASCAL VOC数据集和KITTI数据集上检测精度分别达到83.0%、83.8%,相比基准算法分别提高了1%、2%.结果表明,该算法具有较强的尺度适应能力,能有效提高目标检测的精度.
锚点框匹配、Transformer、目标检测、K-Means++、全局信息、检测性能
46
TN911.73-34;TP391
陕西省自然科学基础研究计划项目;陕西省重点研发计划项目
2023-08-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
37-42