10.7644/j.issn.1674-9960.2015.10.002
一种快速自动分析流式数据方法研究
目的:流式数据分析的主要过程是对样本数据中的细胞进行类群划分。针对传统人工分析数据方式的缺点,提出一种快速自动数据分析方法。方法不同于人工二维逐次投影设门分析方法,该方法基于冗余的K-means聚类结果,通过同类细胞亚群合并方式实现多维流式数据直接分析。针对流式数据的特点,提出核密度估计初始化类群数目和k-d树优化算法效率。对冗余的聚类结果,提出两段回归拟合算法确定最优分类。结果分析实验1数据的误判率为0.0736,分析时间为2 s;分析实验2数据误判率为0.0805,分析时间为1 s。结论相比基于概率聚类方法和非概率聚类方法,该法不仅能快速对多维流式数据进行直接分析,且分析结果更准确,误判率更低。
流式细胞术、聚类分析、核密度估计、K-means、k-d树、T淋巴细胞亚群、数据说明、统计
Q2-33;O652.9
国家科技重大专项资助项目2012ZX10004801
2015-11-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
736-741