darknet-dataset-2020
收藏github2024-04-24 更新2024-05-31 收录
下载链接:
https://github.com/huyz97/darknet-dataset-2020
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了Tor、I2P、ZeroNet和Freenet中的用户行为流量。我们根据8种不同的用户行为类别(浏览、聊天、电子邮件、音频流、视频流、文件传输、P2P和VoIP)对这些网络中的常用应用程序进行了研究,以模拟各种用户行为。数据集通过捕获pcap文件并使用CICFlowMeter进行特征提取,最终分为6个csv文件。
This dataset encompasses user behavior traffic from Tor, I2P, ZeroNet, and Freenet. We conducted a study on common applications within these networks, categorizing them into eight distinct user behavior types (browsing, chatting, email, audio streaming, video streaming, file transfer, P2P, and VoIP) to simulate a variety of user activities. The dataset was compiled by capturing pcap files and utilizing CICFlowMeter for feature extraction, ultimately divided into six CSV files.
创建时间:
2020-07-26
原始信息汇总
数据集概述
数据集名称
darknet-dataset-2020
数据集内容
包含Tor、I2P、ZeroNet和Freenet中的用户行为流量数据。
用户行为分类
数据集将暗网用户行为分为8个类别:
- Browsing
- Chat
- Audio-streaming
- Video-streaming
- File Transfer
- P2P
- VoIP
数据处理
使用CICFlowMeter进行特征提取。数据集被分为6个csv文件,每个文件对应一个本地分类器。
数据统计
| Browsing | Chat | File Transfer | P2P | Audio | Video | VoIP | Total | ||
|---|---|---|---|---|---|---|---|---|---|
| Tor | 1281 | 841 | 553 | 1077 | 1018 | 1567 | 1703 | 592 | 8632 |
| I2P | 1921 | 442 | 1084 | 1791 | 2910 | - | - | - | 8148 |
| ZeroNet | 7972 | 1531 | 352 | 2157 | 1394 | 820 | 1251 | - | 15477 |
| Freenet | 4990 | 1123 | 2980 | 4897 | - | - | 2397 | - | 16387 |
原始数据下载
原始Pcap数据集可通过Google Drive下载:链接
搜集汇总
数据集介绍

构建方式
在构建darknet-dataset-2020数据集时,研究者深入探索了Tor、I2P、ZeroNet和Freenet等暗网平台中的用户行为流量。通过对这些平台中常用的应用程序进行详细调查,模拟了八种不同的用户行为类别,包括浏览、聊天、电子邮件、音频流、视频流、文件传输、P2P和VoIP。数据采集过程中,研究者捕获了pcap文件,并利用CICFlowMeter工具进行特征提取。为了适应用户行为层次分类器的需要,数据集被划分为六个csv文件,每个文件对应一个局部分类器,从而确保了数据的结构化和分类的准确性。
特点
darknet-dataset-2020数据集的显著特点在于其涵盖了多种暗网平台和广泛的用户行为类别。数据集不仅包含了Tor、I2P、ZeroNet和Freenet的流量数据,还详细区分了八种不同的用户行为,提供了丰富的行为特征。此外,数据集的结构化设计,即六个csv文件的划分,使得数据处理和分类任务更加高效和精确。统计表中详细列出了各平台在不同行为类别中的数据量,为研究者提供了直观的数据分布情况,便于进行深入的分析和模型训练。
使用方法
使用darknet-dataset-2020数据集时,研究者可以直接从Google Drive下载原始的pcap数据集,并利用CICFlowMeter工具进行特征提取,生成六个csv文件。这些文件分别对应不同的用户行为类别,便于进行分类和分析。数据集适用于多种机器学习和数据分析任务,如用户行为分类、流量分析和网络安全研究。通过引用相关的研究论文,研究者可以进一步了解数据集的构建背景和应用场景,确保在科学研究中正确使用该数据集。
背景与挑战
背景概述
darknet-dataset-2020数据集由Yuzong Hu等研究人员于2020年创建,旨在深入研究Tor、I2P、ZeroNet和Freenet等暗网平台中的用户行为流量分类问题。该数据集通过捕获网络流量并使用CICFlowMeter进行特征提取,将用户行为划分为浏览、聊天、电子邮件、音频流、视频流、文件传输、P2P和VoIP等八类。其核心研究问题在于如何有效分类和识别暗网中的多样化用户行为,这一研究对网络安全、隐私保护及行为分析等领域具有重要意义。
当前挑战
该数据集面临的挑战主要集中在两个方面:首先,暗网环境的匿名性和复杂性使得流量数据的捕获和分类变得异常困难,尤其是不同暗网平台间的差异性增加了数据处理的复杂度。其次,用户行为的多样性和动态变化要求分类模型具备高度的适应性和准确性,现有的分类方法在处理多类别、多层次的分类任务时仍存在一定的局限性。此外,数据集的构建过程中还需克服数据隐私保护和匿名化处理的难题,以确保研究符合伦理和法律要求。
常用场景
经典使用场景
darknet-dataset-2020数据集的经典使用场景主要集中在对暗网用户行为的分类与分析。该数据集通过捕捉Tor、I2P、ZeroNet和Freenet网络中的用户行为流量,并将其细分为浏览、聊天、电子邮件、音频流、视频流、文件传输、P2P和VoIP等八类行为。研究者可以利用这些数据进行用户行为模式的识别与分类,从而深入理解暗网中的网络活动特征。
实际应用
在实际应用中,darknet-dataset-2020数据集可用于开发和测试暗网流量分类算法,帮助网络安全专家识别和监控潜在的恶意活动。此外,该数据集还可用于训练机器学习模型,以自动识别和分类暗网中的用户行为,从而提升网络安全防护的效率和准确性。其在网络安全领域的应用前景广阔,尤其在对抗网络犯罪和保护用户隐私方面具有重要价值。
衍生相关工作
基于darknet-dataset-2020数据集,研究者已开展了一系列相关工作,包括但不限于暗网流量分类算法的优化、用户行为模式的可视化分析以及隐私保护技术的研究。这些工作进一步推动了暗网行为分析领域的发展,并为后续研究提供了丰富的理论和实践基础。通过这些衍生工作,研究者能够更深入地探索暗网中的复杂网络行为,并为网络安全领域提供更多创新解决方案。
以上内容由遇见数据集搜集并总结生成



