社会统计分析中的悖论与变换问题
如何解释隐现于列联表中的辛普森悖论,如何区分回归中logit变换与probit变换的内在差异与背后假定,是社会统计分析中两大应用性问题.文章从社会统计对象的独特特征出发,认为辛普森悖论与其说是"悖论".不如说是反映了分类数据的非线性特征,反映了列联表从高维压缩至低维时的统计信息差异,实质上是欧氏空间的降维问题.同理,在回归分析中,由于分类数据的非线性特征,无论logit变换,还是probit变换,实际上只有在0.2~0.8之间才基本呈现线性,在这个范围之外,两个函数都是高度非线性的.
辛普森悖论、分类数据非线性特征、logit变换、probit变换
C81(统计方法)
教育部人文社会科学研究青年基金资助项目10YIC840014;中国博士后科学基金资助项目20100470620]
2011-07-08(万方平台首次上网日期,不代表论文的发表时间)
24-25