10.3969/j.issn.1000-3428.2013.05.038
基于哈夫曼树的雷电数据采样算法
对具有非平衡特征的海量雷电气象数据集,采用基于欧式距离的样本欠采样算法时效率较低.为解决该问题,提出一种基于哈夫曼树的雷电数据采样算法.使用哈夫曼树构建方法估算雷电样本的簇中心及簇内样本个数,利用得到的结果并结合欧式距离的样本欠采样算法进行非雷电样本采样.对27 552条真实数据做采样实验,结果表明,该算法的采样时间约为16 min,不仅能降低数据量,而且能提高算法的时间性能.
雷电预报、非平衡数据、欠采样算法、哈夫曼树、支持向量机
39
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目61070139;江西省自然科学基金资助项目20114BAB201039;江西省科技支撑计划基金资助项目20112BBG70087;江西省教育厅科技计划基金资助项目GJJ11286
2013-11-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
174-177,182