10.3969/j.issn.1672-9722.2019.10.025
基于AVX与OpenMP的LIBSVM并行优化研究?
为解决支持向量机(SVM)分类算法性能不能满足实时性要求的问题,提出了一种使用Intel高级矢量扩展指令集(AVX)对SVM分类算法进行并行加速的计算方法.首先以LIBSVM的串行版本作为算法优化的基准,分析了LIBSVM训练阶段产生的模型文件读入内存后的布局特点,给出了满足AVX指令集操作的内存布局优化方案,接着在满足分类结果精度的前提下以单精度代替双精度浮点,提高了算法的并行度,最后使用OpenMP技术在多核平台下对并行算法进行了多线程优化,提高了CPU计算资源的利用率.实验结果表明,并行优化版本相对其串行版本加速约15倍左右,满足了系统的性能要求.
高级矢量扩展指令集、支持向量机、并行度、内存布局、LIBSVM
47
TP391(计算技术、计算机技术)
国家自然科学基金项目61603262;辽宁省教育厅科学研究一般项目L2015380
2019-11-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
2503-2508