基于遗漏变量视角的分类方法改进及应用
在遗漏重要自变量时,传统logistic模型的最大似然估计值通常情况下是有偏估计,但自变量的分布情况会影响参数估计的有偏程度.通过传统logistic模型的输出概率的区间划分来进行数据分组,得到了改进的门限随机效应logistic模型,通过Monte Carlo数值模拟发现,给出的数据分组方法可以有效地把受遗漏重要自变量影响大小不同的数据分离开,相对于传统logistic模型和随机效应logistic模型,门限随机效应logistic模型具有更高的分类准确性,并且该模型在清洗数据和分组决策方面有着很好的应用.
随机效应logistic模型、自变量分布、数据分组
32
F224;O212.1(经济计算、经济数学方法)
国家社会科学基金青年项目《大数据背景下金融统计方法研究》14CTJ008;中国博士后科学基金第58批面上资助项目《基于数据挖掘的金融大数据的随机动态分析》2015M582317
2017-10-19(万方平台首次上网日期,不代表论文的发表时间)
共8页
23-30