10.3772/j.issn.1000-0135.2013.02.008
基于基序及其时序关系的耦合流数据分类算法
耦合流数据分类问题是当前数据挖掘与信息领域的热点和难点,引起国内外越来越多学者的关注,但现有研究成果大多依赖于从单个流数据中提取特征并进行分类,没有考虑到流数据内以及流数据间特征的相互依赖关系.基于此,借鉴生物信息学中基序查找的方法,本文提出了长期频率和逆文档频率的分类方法,该方法主要是将耦合流数据中每个输入流都转化为信号变化特征,以便有效地提取基序,通过计算基序的频率、长期频率与逆文档频率的权重,用以衡量不同输入耦合流数据的基序之间的时序关系,并利用基序与时序的关系实现对耦合流数据的分类,仿真实验的结果也证明了该方法的有效性.
基序、时序、耦合流数据、长期频率和逆文档频率
32
TP3;TP1
中国博士后科学基金项目20100481284;山东省优秀中青年科学家科研奖励基金项目BS2012SF024;山东省博士后创新基金项目201003083
2013-03-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
190-197