基于ngram多特征的流量载荷类型分类方法(论文)

时间:2022-08-07 07:16:49
【文件属性】:

文件名称:基于ngram多特征的流量载荷类型分类方法(论文)

文件大小:1.3MB

文件格式:ZIP

更新时间:2022-08-07 07:16:49

安全 机器学习

丁杰u 黄亮3庹宇鹏〃 桑亚飞u 张永铮1 1(中国科学院信息工程研究所北京100093) 2(中国科学院大学北京100049) 3 (国家计算机网络应急技术处理协调中心北京100029) VoL34 No.2 Feb. 2017 摘 要 相关研究具有重要意义。 目前,网络流量分类技术主要按照应用类型或者协议类型对网络流量分类,不能够对未 知流量和加密流量进行分析和识别。因此提出一种基于n-gram多特征的流量载荷类型分类方法来实现对网络 数据包中传输内容的类型的识别,即将流量按照其载荷类型分为文本、音频、视频、图片、可执行文件、压缩加密七 类。首先利用阈值筛选出高频连续子串集合,进而在该集合上提取多样化的特征来刻画连续子串的频数分布,最 后 基 于 C 4 . 5 决 策 树 对 流 量 载 荷 类 型 进 行 准 确 分 类 。 实 验 验 证 表 明 ,在 仅 使 用 每 条 流 1 K B 数 据 的 情 况 下 ,分 类 载荷类型的平均准确率和平均召回率分别达到了 92.7% 和91.9% ,与基于熵值的分类方法相比,平均准确率和 平均召回率分别提高近10.8 % 和12.1% 。 关键词 流量分类载荷类型统计特征机器学习


【文件预览】:
基于ngram多特征的流量载荷类型分类方法.pdf

网友评论