public-disclosures

Hugging Face2026-05-11 更新2026-05-12 收录

下载链接：

https://huggingface.co/datasets/0dinai/public-disclosures

下载链接

链接失效反馈

官方服务：

资源简介：

0DIN公共生成式AI漏洞披露数据集是Mozilla旗下0Day Investigative Network（0DIN）负责任披露计划每周发布的生成式AI安全漏洞公开披露记录的集合。该数据集旨在提供标准化、结构化的AI安全漏洞信息，用于研究AI模型的安全性和鲁棒性。数据集核心文件为vulnerabilities.jsonl，每条记录对应一个在0DIN官方网站上公开披露的漏洞，包含15个字段：唯一标识符（uuid）、漏洞标题（title）、摘要（summary）、严重程度（severity，分为low、medium、high、severe）、安全边界（security_boundary）、社会影响评分（social_impact_level，1-5）、裸体图像风险评分（nude_imagery_score_level，1-5）、越狱分类法（taxonomy）、测试结果（test_results，包含模型、供应商、测试类型、结果和温度）、受影响模型列表（models）、研究人员署名（researcher_credit）、参考链接（reference_urls）、披露时间（disclosed_at）和发布时间（published_at）。数据集规模小于1000条记录，按发布时间降序排列，并排除了具体的攻击提示词、模型回复、攻击载荷、检测签名、变体提示以及研究人员个人身份信息（除自愿公开署名外），仅保留经过审核的公开元数据。适用于AI安全研究、红队测试、越狱和提示注入攻击分析、漏洞模式分类以及文本分类等任务，采用Creative Commons Attribution 4.0 International (CC-BY-4.0)许可证。

The 0DIN Public Generative AI Vulnerability Disclosure Dataset is a collection of publicly disclosed generative AI security vulnerability records released weekly by the 0Day Investigative Network (0DIN) responsible disclosure program under Mozilla. This dataset aims to provide standardized, structured AI security vulnerability information for researching the safety and robustness of AI models. The core file is vulnerabilities.jsonl, with each record corresponding to a vulnerability publicly disclosed on the 0DIN official website, containing 15 fields: unique identifier (uuid), vulnerability title (title), summary, severity (categorized as low, medium, high, severe), security boundary, social impact level (1-5), nude imagery score level (1-5), taxonomy, test results (including model, vendor, test type, result, and temperature), affected model list (models), researcher credit, reference URLs, disclosed time (disclosed_at), and published time (published_at). The dataset has fewer than 1000 records, sorted in descending order by published time, and excludes specific attack prompts, model responses, attack payloads, detection signatures, variant prompts, and researcher personal identification information (except for voluntarily provided public credit), retaining only reviewed and public metadata. It is suitable for AI security research, red team testing, jailbreak and prompt injection attack analysis, vulnerability pattern classification, and text classification tasks, and uses the Creative Commons Attribution 4.0 International (CC-BY-4.0) license.

创建时间：

2026-05-08

原始信息汇总

数据集概述：0DIN Public GenAI Vulnerability Disclosures

基本信息

数据集名称：0DIN Public GenAI Vulnerability Disclosures
许可证：Creative Commons Attribution 4.0 International (CC-BY-4.0)
语言：英语（en）
数据规模：n < 1K（少于1000条记录）
任务类型：文本分类（text-classification）
标签：AI安全、红队测试、越狱攻击、提示注入、漏洞披露、生成式AI

数据来源与发布者

由 0DIN（0Day Investigative Network）发布，这是Mozilla负责GenAI安全的负责任披露项目。
权威来源：https://0din.ai/disclosures
每周导出一次公开的漏洞披露信息。

数据文件结构

数据集包含以下文件：

vulnerabilities.jsonl：每行一个JSON对象，记录按published_at降序排列，再按uuid升序排列。
manifest.json：包含生成时间、数据集名称、数据集模式版本、记录数、来源URL和发布者的Git SHA。
README.md：本说明文件。

数据模式（每条记录的字段）

字段	类型	说明
`uuid`	字符串	稳定的披露标识符
`title`	字符串	可读的标题
`summary`	字符串	漏洞的简短描述
`severity`	字符串	严重程度：`low`、`medium`、`high`、`severe`之一
`security_boundary`	字符串	0DIN的安全边界分类（详见0DIN研究）
`social_impact_level`	整数或null	社会影响评分（1–5分），如已评估
`nude_imagery_score_level`	整数或null	裸体图像评分（1–5分），如已评估
`taxonomy`	数组	越狱攻击分类三元组：`{category, strategy, technique, security_boundary}`（详见0DIN研究）
`test_results`	数组	仅可见结果：`{model, vendor, test_type, result, temperature}`
`models`	数组	受影响的模型：`{name, vendor}`
`researcher_credit`	字符串或null	`"Anonymous"`、研究人员选择的公开署名，或null（未提供公开署名时）
`reference_urls`	字符串数组	外部参考资料链接
`disclosed_at`	ISO 8601字符串	披露状态转换时间
`published_at`	ISO 8601字符串	公开披露时间

设计上排除的内容

以下信息故意不包含在数据集中：

提示词、模型响应、消息、攻击载荷、检测签名、变体提示词
提交者的个人身份信息（除自供的公开署名外），研究人员姓名从不导出
除SocialImpact和NudeImageryScore外的Vulnerability::Metadatum行
被屏蔽的披露信息无法进入发布状态，在导出前已被0DIN的发布管道排除

联系方式

电子邮箱：0din@mozilla.com

搜集汇总

数据集介绍

构建方式

public-disclosures 数据集由 Mozilla 旗下的 0Day Investigative Network（0DIN）定期编制并公开发布，旨在记录生成式人工智能（GenAI）领域的安全漏洞披露信息。该数据集源自 0DIN 负责任披露计划所收集的漏洞档案，每个记录对应一个已发布的公开披露。数据以 JSONL 格式按发布时间降序排列，并附带 manifest.json 文件提供元数据，确保了数据结构的规范性与可追溯性。

使用方法

研究人员可借助该数据集进行 GenAI 漏洞趋势分析、安全边界评估以及越狱技术分类研究。数据以 JSONL 格式提供，易于加载至 Python 的 pandas 或 JSON 解析库中。用户可根据 severity、social_impact_level 等字段进行筛选，或利用 taxonomy 数组中的分类信息开展细粒度分析。数据集规模小于千条记录，适合用作验证集或案例研究的基础材料。

背景与挑战

背景概述

随着生成式人工智能（GenAI）技术的迅猛发展，其安全性问题日益凸显，尤其是针对大语言模型的越狱攻击、提示注入等漏洞，正成为学术与工业界共同关注的焦点。2024年，Mozilla旗下的0Day Investigative Network（0DIN）推出了首个专门的GenAI漏洞披露计划，并在此基础上构建了public-disclosures数据集。该数据集由0DIN团队维护，以每周更新的频率收录公开的GenAI安全漏洞报告，核心研究问题在于系统性地分类和记录GenAI系统的安全边界漏洞，涵盖从低到严重的严重性等级，以及社会影响与色情内容评分等元数据。作为业界首个结构化GenAI漏洞数据集，它为红队测试、漏洞分类学和AI安全基准测试提供了关键资源，对推动GenAI安全评估的标准化和透明化具有里程碑意义。

当前挑战

该数据集所解决的领域问题主要聚焦于GenAI安全评估中缺乏统一漏洞描述与分类标准的核心挑战。传统软件安全中的CVE等框架难以直接适用于GenAI系统的独特攻击面，例如提示注入和越狱攻击，因此该数据集通过定义安全边界、越狱分类法和社会影响评分等结构化字段，为研究者和工程师提供了可复用的漏洞分析框架。在构建过程中，0DIN面临多重挑战：首先是隐私与透明度的平衡，数据集设计性地排除了攻击载荷和提交者个人身份信息，仅保留必要元数据；其次是数据一致性的维护，需要从持续变化的披露源中提取并标准化字段，如模型名称、供应商和测试结果；此外，还需确保披露的完整性，仅发布已进入公开状态的记录，并维持与权威源站点的同步，这些挑战共同塑造了该数据集的严谨性与实用性。

常用场景

经典使用场景

在生成式人工智能（GenAI）安全研究领域，public-disclosures数据集最为经典的使用场景是系统性地分析并分类已公开的GenAI漏洞披露。研究者可借助该数据集中的severity、security_boundary、taxonomy等字段，对各类漏洞进行细粒度的统计与模式识别，从而揭示当前GenAI模型在对抗性攻击下的薄弱环节。此外，该数据集为红队测试（red-teaming）、越狱攻击（jailbreak）及提示注入（prompt-injection）等方向提供了真实世界的数据基础，使得学术社区能够基于统一的数据基准开展可复现的实证研究。

解决学术问题

该数据集有效解决了GenAI安全研究中长期存在的数据匮乏与不透明问题。此前，漏洞信息常分散于厂商公告或非结构化报告中，难以进行系统化分析。public-disclosures通过提供标准化的字段（如社会影响评分、裸体图像评分、越狱分类法），使得研究者能够定量评估不同类型漏洞的严重程度与潜在社会危害。这推动了从个案报告向大规模风险趋势分析的范式转变，为构建GenAI安全预警机制与制定负责任的披露政策提供了关键的数据支撑。

实际应用

在实际应用中，该数据集已成为AI安全工程师与漏洞赏金平台运营者进行风险优先级排序的核心工具。安全团队可依据severity和social_impact_level字段筛选高危漏洞，并优先修复影响广泛商用的GenAI模型（如由models字段列出的厂商及模型名称）。同时，数据集中的reference_urls字段为漏洞复现与补丁验证提供了直接的技术路径，显著提升了从披露到修复的响应效率。Mozilla的0DIN项目本身也依赖该数据集向社区展示透明、负责任的漏洞处置流程。

数据集最近研究