10.19343/j.cnki.11-1302/c.2020.10.009
异质性大数据的分布式估计
随着物联网技术的进步,大数据给网络带宽和计算机存储能力带来巨大挑战,传统的集中式数据处理难以实现,客观上促进了分布式统计学习的发展.在无迭代算法研究中,Zhang等(2013)证明了当数据集个数s=0(√N)时,基于局部经验风险最小化的分治(DC)简单平均估计量具有0(N-1)均方误差收敛速度,Huang和Huo(2019)在M估计框架下进一步提出分布式一步估计量,但上述方法均未考虑海量数据可能存在的异质性对分治估计效果的影响.本文在线性模型框架下提出海量异质数据的分治一步加权估计,证明了估计量的渐近性质并考虑了异质性检验问题.将本文提出的方法应用于美国医疗保险实际数据分析,结果表明该方法能更好地拟合数据的线性趋势且显著提高了计算效率.
分治策略、一步估计、海量数据、异质性、医疗保险
37
O212(概率论与数理统计)
中国人民大学科学研究基金中央高校基本科研业务费专项资金资助项目"大数据分析的稳健统计理论与应用研究"18XNL012
2021-03-11(万方平台首次上网日期,不代表论文的发表时间)
共11页
104-114