基于塔域的SM4算法快速软件实现
传统上的SM4软件优化采用查表法,其性能受到cache大小制约,而且易遭到缓存-计时攻击.本文给出了面向SIMD实现的SM4的S盒优化实现,基于塔域优化技术,将SM4的8比特S盒布尔表达式结果的比特切片门复杂度从497降低到115.使用SIMD技术的AVX512指令集和比特切片技术实现512组SM4分组消息的并行加解密.基于OpenSSL开源库完成了快速SM4不同工作模式和多线程下加密的性能测速.在Intel Core i7-11800H@2.3 GHz处理器上使用本方案对SM4算法进行的软件优化实现,其ECB模式在单线程下的加密峰值速度达到了6671 Mbps.同已公开文献中的最优实现性能2580 Mbps(Intel Core i7-7700HQ@2.8 GHz)/3306 Mbps(Intel Core i7-11800H@2.3 GHz)相比,性能提升了159%/101%.
SM4算法、比特切片、SIMD、塔域实现
9
TP309.7(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;国家自然科学基金;国防科技173基础加强计划技术领域项目;十三五国家密码发展基金;江苏省自然科学基金;广东省基础与应用基础研究基金;CCF-腾讯犀牛鸟基金;霍英东青年教师基金
2023-02-15(万方平台首次上网日期,不代表论文的发表时间)
共18页
1081-1098