DOI：10.3969/j.issn.1000-3428.2015.02.052

基于协议首部的字节频率统计特征发现方法

引用

摘要：

应用协议识别在网络安全领域具有极其广泛的应用，而如何发现协议特征是协议识别的核心问题。为此，提出一种高效准确的协议特征自动发现方法。利用协议自身的格式特点，将消息进行token化，并根据token序列对消息进行分类。由分类数的变化曲线大致判别协议的首部长度，从而确定字频统计的范围。对数据流中每个数据包的消息首部进行字节频率统计，并将字节频率进行归一化处理，得到字节频率特征向量。通过计算待测协议与样本协议的余弦相似度对协议进行分类和识别。实验结果表明，用该方法所提取的特征进行识别，准确率超过93.5%。

关键词：协议识别、token化、字节频率、特征向量、余弦相似度

分类号：TP301.6(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目61309007;国家“863”计划基金资助项目2012AA012902。

在线出版日期：2015-03-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：272-277

英文信息展示

期刊专题