时序数据曲线排齐的相关性分析方法
时序数据是数据挖掘的一类重要对象。在做时序数据分析时,若不考虑数据的时差,则会造成相关性的误判。所以,时序数据存在相关性和时差相互制约的问题。通过对时序数据的相关性和协同性进行研究,给出了双序列的相关性判定方法和曲线排齐方法。首先,从时间弯曲的角度分析了两类相关性错误产生的原因及其特点;然后,根据相关系数的渐近分布得到相关系数在一定显著性水平上的界,将两者综合得到基于时移序列相关系数特征的相关性判定方法;最后,提出一种基于相关系数最大化的曲线排齐模型,其适用范围比AISE准则更广。模型采用光滑广义期望最大化(S-GEM)算法求解时间弯曲函数。在构造数据和真实数据上的数值实验结果表明:该相关性判别方法在伪回归识别中,比常规的3种相关系数以及Granger因果检验更有效;提出的S-GEM算法在大多数情况下明显优于连续单调排齐法(CMRM)、自模型排齐法(SMR)和极大似然排齐法(MLR)。该文考虑的是双序列的线性相关问题和函数型曲线排齐方法,这些结果可为回归分析的相关性判定和时间对齐提供理论基础,并为多序列相关性分析和曲线排齐提供参考方向。
伪回归、时间弯曲、相关性、曲线排齐、曲线光滑
TP311(计算技术、计算机技术)
国家自然科学基金61273291,71031006;山西省回国留学人员科研基金2012-008;中国民航信息技术科研基地开放基金CAAC-ITRB-201305
2014-09-23(万方平台首次上网日期,不代表论文的发表时间)
共16页
2002-2017