10.19343/j.cnki.11-1302/c.2022.07.010
考虑数据源网络结构的高维数据整合分析与子群识别研究
大数据时代,收集到的数据维度越来越高,数据来源也越来越多.针对多源高维数据,本文提出了一种考虑数据源网络结构的多源高维数据整合分析方法,利用k近邻方法构建数据源间的网络结构,对于有网络连接的数据集的模型系数施加Network MCP惩罚来自动识别同质数据和异质数据,并利用MCP惩罚筛选每个数据集的重要变量,能同时进行各数据源的模型估计、变量选择以及数据源的子群识别.模拟实验表明,在不同的模拟设置下本文所提方法在变量选择、参数估计和分类预测准确率上都有良好的效果.最后,将该方法应用到房地产租赁评价数据上,利用经纬度位置信息构建数据源间的网络结构,可以很好地识别出房地产子市场,并在模型上具有更好的解释性.
多源高维数据、整合分析、网络结构、子群识别
39
F222.1(经济计算、经济数学方法)
国家自然科学基金;教育部人文社会科学研究项目;国家社会科学基金
2022-08-17(万方平台首次上网日期,不代表论文的发表时间)
共12页
125-136