10.3969/j.issn.1000-3428.2015.02.052
基于协议首部的字节频率统计特征发现方法
应用协议识别在网络安全领域具有极其广泛的应用,而如何发现协议特征是协议识别的核心问题。为此,提出一种高效准确的协议特征自动发现方法。利用协议自身的格式特点,将消息进行token化,并根据token序列对消息进行分类。由分类数的变化曲线大致判别协议的首部长度,从而确定字频统计的范围。对数据流中每个数据包的消息首部进行字节频率统计,并将字节频率进行归一化处理,得到字节频率特征向量。通过计算待测协议与样本协议的余弦相似度对协议进行分类和识别。实验结果表明,用该方法所提取的特征进行识别,准确率超过93.5%。
协议识别、token化、字节频率、特征向量、余弦相似度
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目61309007;国家“863”计划基金资助项目2012AA012902。
2015-03-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
272-277