JBShield Dataset|网络安全数据集|自然语言处理数据集
收藏JBShield 数据集概述
数据集简介
- 数据集名称:JBShield
- 数据集用途:用于研究防御大型语言模型免受越狱攻击的方法
- 论文信息:发表于第34届USENIX安全研讨会(2025年)
- 论文arXiv链接:arXiv: 2502.07557
- 数据集许可证:MIT
硬件要求
- 最小硬件要求:两块至少24GB VRAM的GPU(例如RTX 3090或RTX 4090)
- 推荐硬件配置:4 RTX 4090 GPUs(每块24GB VRAM)或1 A100 GPUs(80GB VRAM)
环境要求
- Python版本:3.12.8
- PyTorch版本:2.5.1
- 推荐使用:Anaconda或miniconda
数据集结构
- 数据集位置:
./data
- 越狱提示位置:
./data/jailbreak
- 有害和无害提示位置:
./data/harmful{.csv}
和./data/harmless{.csv}
- 校准数据位置:
./data/jailbreak/{jailbreak_name}/{model_name}_calibration.json
- 测试数据位置:
./data/jailbreak/{jailbreak_name}/{model_name}_test.json
模型准备
- 目标LLM模型:Mistral-7B-Instruct-v0.2, Llama-2-7b-chat-hf, Meta-Llama-3-8B-Instruct, vicuna-7b-v1.5, vicuna-13b-v1.5
- 评估LLM模型:ft-mistral-7b-instruct-v0.2-sorry-bench-202406
数据集组成
- 越狱提示:包含用于攻击的提示
- 有害和无害提示:分别包含有害和无害的提示数据
代码和结果
- 概念分析代码和结果:用于分析五个目标LLM的概念相关令牌
- 检测性能结果:
JBShield-D
在不同LLM上的检测性能(准确率/F1分数) - 缓解性能结果:
JBShield-M
在不同LLM上的缓解性能(攻击成功率)
引用
tex @misc{zhang2025jbshield, title={JBShield: Defending Large Language Models from Jailbreak Attacks through Activated Concept Analysis and Manipulation}, author={Shenyi Zhang and Yuchen Zhai and Keyan Guo and Hongxin Hu and Shengnan Guo and Zheng Fang and Lingchen Zhao and Chao Shen and Cong Wang and Qian Wang}, year={2025}, eprint={2502.07557}, archivePrefix={arXiv}, primaryClass={cs.CR} }

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
ISIC 2018
ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。
challenge2018.isic-archive.com 收录
新型人类活动识别数据集
该数据集由都灵理工大学和马尔默大学合作创建,包含7类活动,利用60 GHz毫米波FMCW雷达在真实环境中收集。数据集旨在支持机器学习和深度学习模型在人类活动识别方面的研究,特别是对雷达特征图的时空结构进行保留的多维特征向量。数据集将公开,以推动FMCW雷达在智能环境监测中的应用研究。
arXiv 收录