基于多尺度注意力机制相位展开的三维人脸建模
相位展开作为三维(3D)测量技术中的关键环节,其解析精度直接影响3D建模的精度.由于存在欠采样和相位不连续等问题,故传统空间相位展开难以得到正确的相位信息,而时间相位展开又需要额外的信息辅助.针对复杂场景中的3D人脸建模,提出了基于多尺度注意力机制的相位展开网络.在所提网络中,利用编码器-解码器结构融合多尺度特征,并在解码网络中嵌入注意力子网络以获取上下文信息.构建一个包含5000组样本的FACE数据集和一个包含100组样本的MASK数据集,每组样本均包含截断相位和连续相位的真值,这些真值可用于相位展开的训练及测试.所提网络在FACE数据集和MASK数据集上的均方根误差分别为0.0387 rad和0.0273 rad,结构相似性分别为0.9850和0.9793.在欠采样、相位不连续等区域中,所提网络可快速准确地提取相位特征,进而保证了相位展开的正确性.最后,通过对比实验证实了所提网络的有效性和可行性.
测量、三维人脸建模、相位展开、多尺度注意力机制融合、上下文特征信息、编码器-解码器结构
42
TP391.4(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;四川省重点研发专项;四川省重点研发专项;四川省重点研发专项;四川省重大科技专项;四川省重大科技专项
2022-03-22(万方平台首次上网日期,不代表论文的发表时间)
共12页
147-158