five

swj0419/BookMIA

收藏
Hugging Face2023-11-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/swj0419/BookMIA
下载链接
链接失效反馈
官方服务:
资源简介:
BookMIA数据集是一个用于评估成员推断攻击(MIA)方法的基准数据集,特别用于检测OpenAI模型在2023年之前发布的预训练数据。数据集包含非成员数据和成员数据:非成员数据来自2023年首次出版的书籍,成员数据则来自较早出版的书籍。该数据集适用于2023年之前发布的多种OpenAI模型,如text-davinci-001和text-davinci-002等。数据集的文本长度为512,标签0表示在预训练期间未见过的数据,标签1表示在预训练期间见过的数据。

The BookMIA dataset is a benchmark for evaluating Membership Inference Attack (MIA) methods, specifically developed to detect pre-training data of OpenAI models released prior to 2023. It comprises non-member data and member data: non-member data is sourced from books first published in 2023, whereas member data comes from books published at an earlier date. This dataset is compatible with multiple OpenAI models released before 2023, including text-davinci-001 and text-davinci-002. Each text sample in the dataset has a fixed length of 512, with label 0 representing data not encountered during pre-training, and label 1 representing data seen during pre-training.
提供机构:
swj0419
原始信息汇总

📘 BookMIA 数据集

BookMIA 数据集 是一个用于评估成员推理攻击(MIA)方法的基准数据集,特别是用于检测 OpenAI 模型在2023年之前发布的预训练数据(例如 text-davinci-003)。

数据集包含非成员数据和成员数据:

  • 非成员数据包括2023年首次出版的书籍中的文本摘录。
  • 成员数据包括根据 Chang 等人在2023年的分类,来自较旧书籍的文本摘录。

📌 适用性

该数据集可应用于2023年之前发布的各种 OpenAI 模型:

  • text-davinci-001
  • text-davinci-002
  • 以及其他更多模型。

加载数据集

加载数据集的代码如下:

python from datasets import load_dataset

dataset = load_dataset("swj0419/BookMIA")

  • 文本长度:512
  • 标签0:表示预训练期间未见过的数据。标签1:表示预训练期间见过的数据。

引用我们的工作

如果您发现我们的代码库和数据集有益,请引用我们的工作:

bibtex @misc{shi2023detecting, title={Detecting Pretraining Data from Large Language Models}, author={Weijia Shi and Anirudh Ajith and Mengzhou Xia and Yangsibo Huang and Daogao Liu and Terra Blevins and Danqi Chen and Luke Zettlemoyer}, year={2023}, eprint={2310.16789}, archivePrefix={arXiv}, primaryClass={cs.CL} }

搜集汇总
数据集介绍
main_image_url
构建方式
在自然语言处理领域,评估模型对训练数据的记忆程度至关重要。BookMIA数据集的构建基于精心的时序划分原则,其非成员数据选自2023年首次出版的书籍文本片段,确保这些内容在指定模型预训练时尚未公开;成员数据则源自更早出版的书籍文本,依据Chang等人2023年的分类体系进行筛选。所有文本均统一截取为512个字符的长度,并标注二元标签:0代表模型未见的非成员数据,1代表模型已见的成员数据,从而构建了一个针对预训练数据检测的基准测试集。
特点
该数据集的核心特点在于其明确的时序边界与针对性设计。它专门面向2023年前发布的OpenAI模型(如text-davinci系列),通过新旧出版时间的对比,清晰区分了模型可能接触过的历史文本与未曾接触的新颖文本。数据集结构简洁,仅包含文本内容与对应的成员标签,便于直接用于成员推理攻击方法的评估。此外,数据集与配套的代码库紧密关联,为复现和比较不同检测方法提供了标准化基础。
使用方法
使用BookMIA数据集时,研究人员可通过Hugging Face的datasets库直接加载。加载后,数据集以标准格式提供文本序列和标签,用户可将其输入到成员推理攻击检测模型中,以评估模型区分训练数据与非训练数据的能力。典型应用流程包括:利用数据集训练或测试分类器,量化目标语言模型对特定书籍内容的记忆程度。相关实现细节和评估脚本可参考其GitHub代码库,以确保实验的一致性与可复现性。
背景与挑战
背景概述
在大型语言模型(LLM)迅速发展的背景下,其预训练数据的隐私与安全成为学术界关注的焦点。2023年,由Weijia Shi等研究人员构建的BookMIA数据集应运而生,旨在为成员推理攻击(MIA)方法提供基准评估工具,专门用于检测OpenAI在2023年前发布模型的预训练数据。该数据集通过区分成员与非成员文本摘录,核心研究问题聚焦于如何有效识别模型是否记忆了特定训练数据,对推动语言模型隐私保护与安全审计领域具有重要影响力。
当前挑战
BookMIA数据集所解决的领域问题在于成员推理攻击的评估,其挑战包括如何在高维文本特征中准确区分模型对训练数据的记忆模式,以及应对不同模型架构带来的泛化性要求。在构建过程中,研究人员面临数据选择的复杂性,需依据书籍出版年份严谨划分成员与非成员类别,并确保文本长度统一为512字符以维持评估一致性,同时依赖外部研究进行可靠的数据分类,这增加了数据集构建的精确性与可靠性难度。
常用场景
经典使用场景
在人工智能安全与隐私保护领域,BookMIA数据集作为基准工具,专为评估成员推理攻击方法而设计。该数据集通过对比2023年首次出版的书籍摘录(非成员数据)与早期出版的书籍摘录(成员数据),模拟了检测大型语言模型预训练数据泄露的场景。研究人员利用这一数据集,能够系统性地测试模型在区分已见与未见文本时的性能,从而深入探究模型记忆机制与数据隐私边界。
衍生相关工作
围绕BookMIA数据集,已衍生出一系列经典研究工作。例如,Chang等人对ChatGPT/GPT-4所知书籍的考古学分析为数据集的构建提供了理论基础。同时,基于该数据集的成员推理攻击评估框架催生了多种新颖的检测方法,这些工作进一步深化了对模型记忆行为与隐私边界的理解,推动了人工智能安全领域的交叉创新与理论进展。
数据集最近研究
最新研究方向
在大型语言模型隐私与安全领域,BookMIA数据集作为评估成员推理攻击方法的基准,聚焦于检测OpenAI模型在2023年前预训练数据中的成员信息。前沿研究借助该数据集,深入探索模型训练数据泄露风险,关联到生成式人工智能伦理与数据版权保护等热点议题。通过区分新旧书籍文本片段,研究不仅推动成员推理攻击技术的精细化发展,还促进了模型透明度与问责机制的完善,对构建可信人工智能系统具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作