CICIDS2017|入侵检测数据集|网络安全数据集
收藏
- CICIDS2017数据集首次发表,由加拿大网络安全研究所(Canadian Institute for Cybersecurity)发布,旨在模拟真实世界的网络流量,用于网络入侵检测系统的研究和评估。
- CICIDS2017数据集首次应用于多个学术研究项目,包括但不限于机器学习算法在网络入侵检测中的应用、特征选择方法的评估以及深度学习模型在网络安全领域的探索。
- CICIDS2017数据集被广泛认可为网络入侵检测领域的重要基准数据集,多个国际会议和期刊论文引用该数据集作为实验基础,推动了相关技术的进一步发展。
- CICIDS2017数据集的扩展版本发布,增加了更多的网络攻击类型和更复杂的网络流量模式,以适应不断变化的网络安全威胁环境。
- CICIDS2017数据集的应用范围进一步扩大,涉及物联网安全、云计算安全以及边缘计算安全等多个新兴领域,成为跨学科研究的重要资源。
- 1Unsupervised Anomaly Detection in Network Traffic Using LSTM AutoencoderUniversity of New Brunswick · 2019年
- 2A Deep Learning Approach for Network Intrusion Detection SystemUniversity of New Brunswick · 2017年
- 3A Survey on Network Intrusion Detection Systems Using Machine Learning TechniquesUniversity of New Brunswick · 2020年
- 4Deep Learning for Network Intrusion Detection: A SurveyUniversity of New Brunswick · 2021年
- 5Anomaly Detection in Network Traffic Using AutoencodersUniversity of New Brunswick · 2020年
Med-MAT
Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。
huggingface 收录
rag-datasets/rag-mini-bioasq
该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。
hugging_face 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
Sleep
该数据集包含关于睡眠效率和持续时间的信息,每个条目代表一个独特的睡眠体验,并包括ID、年龄、性别、睡眠持续时间、睡眠效率、REM睡眠百分比、深度睡眠百分比、轻度睡眠百分比、觉醒次数、咖啡因消费、酒精消费和吸烟状况等列。
github 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录