一种改进的贝叶斯逻辑回归核心集构建算法

引用

摘要：

随着互联网的高速发展,新型信息发布方式不断涌现,由此所产生的数据正以前所未有的速度"爆炸式"增长.如何处理和分析庞大的原始数据,并将之变成可用知识加以学习和利用,已成为国内外科学家和技术专家共同关注的重要课题.贝叶斯方法提供了丰富的分层模型、不确定的量化及预先的规范,因此其在大规模数据背景下的使用十分具有吸引力.限制迭代的二分K-means算法保留了近似标准二分K-means算法的聚类质量且拥有更高的计算效率,更适用于需要处理速度更快的大型数据集.针对原有核心集构建算法执行效率低的问题,对限制迭代的二分k-means算法进行改进,使其在保证聚类效果的情况下更快速地得到聚类结果并计算相关数据点权值,从而构建出核心集.实验证明,与原算法相比,改进后算法的计算效率更高,近似性能相近且在部分情况下近似效果更优.

关键词：核心集、限制迭代二分k-means、贝叶斯逻辑回归、大规模数据集

所属期刊栏目：46

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金111023;高校领军人才引进与培育计划项目051619

在线出版日期：2019-12-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：98-102

英文信息展示

期刊专题