swj0419/WikiMIA
收藏Hugging Face2023-11-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/swj0419/WikiMIA
下载链接
链接失效反馈官方服务:
资源简介:
WikiMIA数据集是一个用于评估成员推断攻击(MIA)方法的基准,特别是在检测大规模语言模型的预训练数据方面。该数据集适用于2017年至2023年间发布的各种模型,如LLaMA1/2、GPT-Neo、OPT、Pythia、text-davinci-001、text-davinci-002等。数据集包含不同长度的文本,标签0表示在预训练期间未见过的数据,标签1表示见过的数据。
WikiMIA数据集是一个用于评估成员推断攻击(MIA)方法的基准,特别是在检测大规模语言模型的预训练数据方面。该数据集适用于2017年至2023年间发布的各种模型,如LLaMA1/2、GPT-Neo、OPT、Pythia、text-davinci-001、text-davinci-002等。数据集包含不同长度的文本,标签0表示在预训练期间未见过的数据,标签1表示见过的数据。
提供机构:
swj0419
原始信息汇总
WikiMIA Datasets 概述
数据集信息
- 许可证: MIT
- 语言: 英语
- 大小分类: 1K<n<10K
数据集特征
- 输入字段 (input): 数据类型为字符串
- 标签字段 (label): 数据类型为int64
数据集分割
- WikiMIA_length32: 776个样本,162091字节
- WikiMIA_length64: 542个样本,221018字节
- WikiMIA_length128: 250个样本,205118字节
- WikiMIA_length256: 82个样本,134879字节
数据集大小
- 下载大小: 465221字节
- 数据集大小: 723106字节
搜集汇总
数据集介绍

构建方式
在自然语言处理领域,评估大型语言模型的数据隐私风险至关重要。WikiMIA数据集通过精心设计的流程构建,其核心在于从多个广泛使用的大型语言模型(如LLaMA、GPT-Neo、OPT等)的预训练语料中采样文本片段,并依据模型是否在预训练阶段接触过这些文本来标注成员身份。具体而言,构建者从维基百科等公开语料库中选取文本,生成长度分别为32、64、128和256个字符的样本,并基于目标模型的训练历史精确划分每个样本的标签,从而形成一个结构清晰、标注可靠的基准测试集。
特点
该数据集在成员推理攻击研究领域展现出鲜明的特色。其最突出的特点在于提供了四种不同文本长度的子集,覆盖了从短句到段落的多种语境,这为评估攻击方法在不同上下文窗口下的鲁棒性提供了便利。数据集严格区分了模型在预训练中见过与未见过的数据,标签定义明确,确保了评估的准确性与一致性。此外,其设计兼容2017年至2023年间发布的多种主流开源与部分闭源模型,具有广泛的适用性和时效性,为横向比较不同攻击算法奠定了坚实基础。
使用方法
研究人员可借助Hugging Face的datasets库便捷地加载并使用该数据集。使用前需指定所需的文本长度参数,通过简单的函数调用即可加载对应的数据分片。数据集中每个样本包含原始文本输入和对应的二分类标签,其中标签‘1’代表成员数据,‘0’代表非成员数据。加载后,数据可直接用于训练或评估成员推理攻击模型,或用于分析模型记忆行为。相关代码库提供了进一步的评估工具,方便进行系统性的实验与结果复现。
背景与挑战
背景概述
在大型语言模型(LLMs)迅速发展的背景下,模型预训练数据的隐私与安全日益成为自然语言处理领域的核心关切。2023年,由普林斯顿大学等机构的研究人员Weijia Shi等人创建的WikiMIA数据集应运而生,旨在为成员推理攻击(MIA)方法提供基准评估工具。该数据集聚焦于检测模型是否在预训练阶段接触过特定文本,其核心研究问题在于量化并缓解LLMs可能引发的数据泄露风险,对推动模型透明度与隐私保护研究具有显著影响力。
当前挑战
WikiMIA数据集致力于应对成员推理攻击在自然语言处理中的挑战,即如何准确识别给定文本是否属于模型预训练数据,这一问题在模型规模扩大和数据来源复杂化的背景下尤为棘手。在构建过程中,研究人员面临多重挑战:一是需要从海量维基百科文本中精心筛选并平衡已见与未见样本,确保数据代表性;二是针对不同文本长度(如32、64、128、256词元)构建多个子集,以适配多样化的模型输入要求,同时保持数据的一致性与评估的严谨性。
常用场景
经典使用场景
在大型语言模型安全与隐私研究领域,WikiMIA数据集作为基准工具,主要用于评估成员推理攻击方法的效能。该数据集通过提供不同文本长度的样本,模拟模型在预训练过程中是否接触过特定数据,为研究者构建了一个标准化的测试环境。其经典应用场景在于,研究人员利用这些数据来训练和验证攻击模型,以检测目标语言模型的预训练数据泄露风险,从而系统性地衡量模型对隐私信息的保护能力。
解决学术问题
该数据集直接针对大型语言模型中日益凸显的隐私泄露问题,为解决成员推理攻击的评估难题提供了关键资源。它使得学术界能够量化模型记忆训练数据的程度,并探究不同模型架构、训练策略对数据隐私的影响。通过标准化的基准测试,研究者在模型安全领域得以比较不同攻击方法的优劣,推动了隐私保护机制的理论发展,为构建更安全、可信的人工智能系统奠定了实证基础。
衍生相关工作
围绕WikiMIA数据集,已衍生出一系列聚焦于模型隐私与安全的前沿研究。相关经典工作深入探索了更高效的成员推理攻击算法,以及针对此类攻击的鲁棒性防御策略。这些研究不仅扩展了数据集本身的应用边界,还催生了新的评估框架和理论分析,共同推动了机器学习安全子领域的知识体系发展,为后续研究提供了重要的方法论参考和比较基准。
以上内容由遇见数据集搜集并总结生成



