互联网中基于用户连接图的流量分类机制
针对机器学习分类算法的“概念漂移”现象,该文提出了一种基于用户连接图的(Host Connection Graph, HCG)流量分类机制.算法将{IP Address, Port}作为用户唯一标识,构建了用户连接图,提出了“用户相似度”的概念;应用“图挖掘”理论将用户连接图划分为互不相交的行为子簇,使得用户之间的相互通信抽象为一种“社会团体”;通过定义基于信息熵的“用户行为模式”(UBM),分析了各个行为子簇背后表现出的业务特征,并使用“UBM+Port”对用户行为子簇进行了业务标签映射,实现了流量分类的目的.仿真实验表明:在不牺牲识别准确率的前提下,算法不仅能克服“概念漂移”问题,还能有效降低算法的计算复杂度.
流量分类、用户连接图、用户相似度、图挖掘
TP393(计算技术、计算机技术)
2013-05-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
958-964