10.3969/j.issn.1673-808X.2023.03.004
基于Transformer的行人重识别网络
针对行人重识别中水平切片方法由于分块特征感受野之间存在交叉重叠带来的分块数量限制问题,提出一种基于Transformer的行人重识别网络结构.首先,输入图像经过CNN网络提取中间特征图,并将特征图进行分块,对每块特征进一步切分成像素级token向量;然后,对各像素级token向量展平并加入位置编码和全局token向量,输入Transform-erIN编码器中;接着,对得到的全局token向量进一步加入分类token向量和位置编码后,输入TransformerOUT编码器,得到最终的编码器输出;最后,取分类token向量并加上全连接后,利用softmax和交叉熵损失对行人进行分类.在Mar-ket-1501、DukeMTMC-reID数据集上的实验结果表明,本方法能够更细粒度地提取特征,并利用Transformer的全局把控能力,进一步提高了切片的数量和分类的精度.
深度学习、行人重识别、transformer、自注意力
43
TP391.41;TP183(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金;桂林电子科技大学研究生教育创新计划
2023-10-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
195-201