10.3969/j.issn.1006-9348.2019.04.040
云计算海量高维大数据特征选择算法研究
为了有效分析云计算环境下的海量高维大数据,需要对数据进行特征选择处理,针对云计算大数据的高动态与高维度特征,提出了基于竞争熵加权结合稀疏原理的在线学习特征选择算法.首先在熵加权迭代的过程中,采用了竞争合并方式对熵加权计算进行优化,降低数据处理的维度,提高算法对高维数据的处理能力;然后引入稀疏分数将局部数据对应的特征做标记,同时根据各自的重要程度排序,去除掉大数据源中的冗余数据;最后,将合并熵加权与稀疏原理应用于在线学习算法框架中,进一步提高算法对高维数据流的处理效率.实验结果验证了提出的算法提高了聚类精度,有效提高了云计算环境下海量高维大数据特征选择的准确性.
云计算、大数据、熵加权、稀疏原理、在线学习
36
TP391.9(计算技术、计算机技术)
2016年教育厅科技类课题JAT160619《基于云存储的高校实时推送技术研究》;2017年福建省高等学校学科带头人培养计划国内访问学者项目闽教师[2017]87号
2019-05-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
190-193