文件名称:MaleX:针对恶意软件研究者的精选恶意软件和良性Windows可执行文件的数据集
文件大小:228KB
文件格式:ZIP
更新时间:2024-04-28 01:08:10
男X MaleX是恶意软件和良性Windows可执行文件示例的精选数据集,适用于恶意软件研究人员。 数据集包含1,044,394个Windows可执行二进制文件,其中864,669被标记为恶意软件,而179,725被标记为良性。 该数据集具有合理数量的样本,足以测试数据驱动的机器学习分类方法,还可以在可伸缩性和适应性方面衡量设计模型的性能。 频域中的恶意软件可视化 在频域中可视化恶意软件的动机是由于文学中恶意软件的“稀疏”特征表示形式,通常是从二进制文件的原始字节或反汇编的指令(n-gram,n-perms)中提取出来的。 将给定的可执行二进制文件读取为16位带符号十六进制向量,并将其划分为相应的二位字节(n-gram字节,n = 2)。 例如,对于字节流0a1bc48a ,对应的二元组将为0a1b , 1bc4和c48a 。 然后,我们使用二元语法频率计数来获得尺寸为256x256的
【文件预览】:
MaleX-master
----LICENSE.md(34KB)
----figs()
--------overview.png(113KB)
--------comparison.png(109KB)
----README.md(5KB)