10.3969/j.issn.1007-130X.2016.05.021
基于SAX方法的时间序列分类问题的多阶段改进研究
分类问题是数据挖掘中的基本问题之一,时间序列的特征表示及相似性度量是时间序列数据挖掘中分类、聚类及模式发现等任务的基础.SAX方法是一种典型的时间序列符号化表示方法,在采用该方法的基础上对时间序列进行分类,不仅可以有效地降维、降噪,而且具有简单、直观等特点,但是该方法有可能造成信息损失并影响到分类结果的准确性.为了弥补信息损失对分类结果的影响,采用了集成学习中大多数投票方法来弥补BOP表示后的信息损失,从而提高整个分类器的效率.针对一些样本在BOP表示中都损失了相似的重要信息,以至于大多数投票无法进一步提高分类效率的问题,进一步提出了结合集成学习中AdaBoost算法,通过对训练样本权重的调整,从而达到以提高分类器性能来弥补信息损失的效果.实验结果表明,将BOP方法与集成学习相结合的方法框架,不仅能很好地处理SAX符号化表示中的信息损失问题,而且与已有方法相比,在分类准确度方面也有显著的提高.
时间序列、SAX、分类、集成学习、多阶段
38
TP311(计算技术、计算机技术)
国家自然科学基金61170223;河南省基础与前沿技术研究计划142300410229;河南省教育厅科学技术研究重点项目13A520453
2016-08-04(万方平台首次上网日期,不代表论文的发表时间)
共9页
988-996