10.3969/j.issn.1673-629X.2015.10.015
适用于协议特征提取的多级T+序列树挖掘算法
网络流量识别对于网络规划、网络管理和安全监测等非常重要。基于应用层的协议特征检测技术已成为网络流量识别的主流方法。但是在高速的网络流量识别的过程中,针对传统协议特征提取算法效率较低、可信度较差等问题,提出了一种适用于协议特征提取的多级T+序列树挖掘算法。该方法首先将序列数据库装入内存,构建多级T+序列树,接着对该树进行裁剪,然后通过构建投影T+序列树和连接等操作得到协议特征序列,最后通过一个实例说明了该算法的执行过程。实验结果表明:该算法较基于PrefixSpan的协议识别算法能有效地减少扫描和产生序列数据库的次数,降低磁盘I/O操作的时间,提高了运行效率,从而保证了提取不同协议特征的正确性和可靠性。
流量识别、网络规划、协议特征、T树、数据挖掘、特征序列、PrefixSpan算法
TP301.6(计算技术、计算机技术)
湖北省教育科学“十二五”规划项目2011B130
2015-11-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
71-75