five

harpomaxx/dga-detection

收藏
Hugging Face2023-05-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/harpomaxx/dga-detection
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含DGA(域名生成算法)生成的域名和正常域名。正常域名来源于Alexa排名前一百万的域名,以及Bambenek Consulting提供的3,161个可疑但非DGA生成的域名,总计1,003,161个正常域名。DGA域名来源于Andrey Abakumov和John Bambenek的仓库,总计1,915,335个DGA域名,涉及51种不同的恶意软件家族。其中约55%的DGA域名样本来自Banjori、Post、Timba、Cryptolocker、Ramdo和Conficker等恶意软件。DGA生成方案包括简单的算术方案(A)和基于单词的方案(W)。算术方案通过计算可直接表示为ASCII字符的序列生成域名,而基于单词的方案则是通过拼接一个或多个单词列表中的单词生成域名。

This dataset contains domain names generated by DGA (Domain Generation Algorithm) and legitimate domain names. Legitimate domain names are sourced from the top 1,000,000 domains ranked by Alexa, plus 3,161 suspicious but non-DGA-generated domains provided by Bambenek Consulting, totaling 1,003,161 legitimate domain names. DGA-generated domain names are sourced from the repositories of Andrey Abakumov and John Bambenek, with a total of 1,915,335 DGA domain names covering 51 distinct malware families. Approximately 55% of the DGA domain name samples originate from malware families such as Banjori, Post, Timba, Cryptolocker, Ramdo, and Conficker. DGA generation schemes include simple arithmetic schemes (A) and word-based schemes (W). Arithmetic schemes generate domain names by computing sequences that can be directly represented as ASCII characters, while word-based schemes generate domain names by concatenating one or more words from a word list.
提供机构:
harpomaxx
原始信息汇总

数据集概述

数据集内容

  • 正常域名:数据集包含来自Alexa排名前一百万的域名,以及由Bambenek Consulting提供的额外3,161个正常域名,这些域名被认为是可疑的但非DGA生成。
  • DGA域名:数据集中的DGA域名来源于Andrey Abakumov和John Bambenek的DGA域名仓库,总数为1,915,335个。

数据集规模

  • 正常域名总数:1,003,161个。
  • DGA域名总数:1,915,335个。

数据集特点

  • DGA域名来源:DGA域名对应51种不同的恶意软件家族。
  • DGA生成方案:包括简单的算术(A)和基于单词(W)的生成方案。
  • DGA域名构成:约55%的DGA域名来自Banjori、Post、Timba、Cryptolocker、Ramdo和Conficker这六种恶意软件。

数据集许可

  • 许可证:CC-BY-2.0
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集用于DGA检测研究,包含大量正常和恶意生成的域名,覆盖多种恶意软件家族,适合用于训练和评估DGA检测模型。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作