charlieqi02/Extraction-Attack-Datasets
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/charlieqi02/Extraction-Attack-Datasets
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-sa-4.0
configs:
- config_name: Enron
data_files:
- split: train
path: Enron/train-*
- config_name: HarryPotter
data_files:
- split: train
path: HarryPotter/train-*
- config_name: HealthCareMagic
data_files:
- split: train
path: HealthCareMagic/train-*
- config_name: Med_Chinese
data_files:
- split: train
path: Med_Chinese/train-*
- config_name: Med_Vietnamese
data_files:
- split: train
path: Med_Vietnamese/train-*
- config_name: Pokemon
data_files:
- split: train
path: Pokemon/train-*
dataset_info:
- config_name: Enron
features:
- name: file
dtype: string
- name: message
dtype: string
splits:
- name: train
num_bytes: 1424661264
num_examples: 517401
download_size: 598565932
dataset_size: 1424661264
- config_name: HarryPotter
features:
- name: context
dtype: string
- name: question
dtype: string
- name: answer
dtype: string
splits:
- name: train
num_bytes: 13733433
num_examples: 25999
download_size: 7013017
dataset_size: 13733433
- config_name: HealthCareMagic
features:
- name: '0'
dtype: string
splits:
- name: train
num_bytes: 124302290
num_examples: 112165
download_size: 74380051
dataset_size: 124302290
- config_name: Med_Chinese
features:
- name: id
dtype: string
- name: url
dtype: string
- name: doctor_faculty
dtype: string
- name: descriptions
dtype: string
- name: dialogue
dtype: string
- name: diagnosis
dtype: string
splits:
- name: train
num_bytes: 125081296
num_examples: 69550
download_size: 56544234
dataset_size: 125081296
- config_name: Med_Vietnamese
features:
- name: answer
dtype: string
- name: question
dtype: string
splits:
- name: train
num_bytes: 10672379
num_examples: 9335
download_size: 5204526
dataset_size: 10672379
- config_name: Pokemon
features:
- name: name
dtype: string
- name: type_1
dtype: string
- name: type_2
dtype: string
- name: caption
dtype: string
splits:
- name: train
num_bytes: 192419
num_examples: 1271
download_size: 71386
dataset_size: 192419
---
提供机构:
charlieqi02
搜集汇总
数据集介绍

构建方式
在语言模型安全评估领域,Extraction-Attack-Datasets的构建体现了对多源异构数据的系统性整合。该数据集通过配置六个独立子集,分别从企业通信、文学创作、医疗咨询及流行文化等不同领域采集原始文本。例如,Enron子集源自公开的企业电子邮件档案,HarryPotter子集则基于文学作品构建问答对,而Med_Chinese与Med_Vietnamese子集分别收录了中越双语医疗对话。每个子集均经过结构化处理,保留了原始数据的语境特征与字段关系,形成了一套专门用于测试模型记忆与信息提取能力的基准数据。
特点
该数据集的核心特征在于其领域覆盖的广泛性与数据结构的多样性。六个子集分别对应截然不同的文本类型与语言风格,从正式商务邮件到虚构文学叙事,再到专业医疗问答,构成了一个多维度的评估场景。数据结构上,各子集依据其内容特性设计了差异化的字段,如医疗对话包含诊断与描述字段,而宝可梦数据则涵盖类型与说明属性。这种设计使得数据集能够全面检验语言模型在不同领域、不同任务形式下的信息泄露风险,为提取攻击研究提供了丰富的实验素材。
使用方法
使用本数据集时,研究者可依据具体评估目标选择相应子集进行实验。数据集主要用于训练或测试语言模型在面临提取攻击时的表现,即模型是否从其训练数据中记忆并可能泄露敏感或受版权保护的信息。每个子集均可直接加载为标准的训练集,用于微调模型或作为黑盒测试的参考语料。例如,可通过输入医疗对话的子集样本来探测模型是否输出训练数据中的具体病例描述。这种应用有助于量化模型的安全边界,并为开发防御机制提供实证基础。
背景与挑战
背景概述
Extraction-Attack-Datasets 是一套专为评估大型语言模型在数据提取攻击场景下安全性与鲁棒性而构建的数据集。该数据集由多个子集构成,涵盖 Enron 电子邮件、HarryPotter 问答、HealthCareMagic 医疗对话、Med_Chinese 与 Med_Vietnamese 医学诊断以及 Pokemon 描述等多样化领域,旨在模拟真实世界中的数据泄露风险。其核心研究问题聚焦于探究语言模型在训练过程中是否可能无意间记忆并泄露敏感信息,从而对隐私保护与模型安全构成潜在威胁。自发布以来,该数据集为学术界与工业界提供了重要的基准工具,推动了对抗性攻击与防御机制的研究进展,尤其在模型审计与安全评估领域产生了深远影响。
当前挑战
该数据集所针对的领域挑战在于,大型语言模型在预训练阶段可能吸收并记忆训练数据中的敏感内容,导致在特定提示下泄露私人或机密信息,从而引发严重的隐私与安全风险。构建过程中的挑战则体现在数据收集与处理的复杂性上:首先,需要从多个异构来源(如电子邮件、医疗记录、文学作品)获取高质量且具有代表性的敏感数据,同时确保法律与伦理合规性;其次,数据标注与结构化要求高度精确,以构建有效的攻击测试案例;此外,多语言与多领域数据的整合需克服格式不一致与语义差异的障碍,以维持数据集的整体一致性与评估效度。
常用场景
经典使用场景
在人工智能安全领域,Extraction-Attack-Datasets为评估大型语言模型的隐私泄露风险提供了关键基准。该数据集通过整合多个子集,如Enron邮件、HarryPotter问答和医疗对话数据,模拟了攻击者从模型训练数据中提取敏感信息的场景。研究人员利用这些结构化文本,系统性地测试模型在生成或回答问题时是否无意间暴露原始训练内容,从而量化模型对记忆性数据的脆弱性。
衍生相关工作
围绕该数据集,衍生了一系列经典研究工作,包括隐私攻击算法的优化与防御机制的创新。例如,基于Enron子集的研究提出了更高效的成员推理攻击方法,而针对HarryPotter子集的工作探索了提示工程在数据提取中的影响。这些成果进一步催生了差分隐私训练、数据清洗技术及模型遗忘方法的发展,形成了AI安全领域一个活跃的研究分支。
数据集最近研究
最新研究方向
在自然语言处理与信息安全交叉领域,Extraction-Attack-Datasets作为评估模型记忆与隐私泄露风险的关键资源,正推动着对抗性攻击与防御机制的前沿探索。当前研究聚焦于利用该数据集中的多样化文本子集,如医疗对话与文学问答,系统分析大型语言模型在训练数据提取攻击下的脆弱性。随着生成式人工智能的广泛应用,模型记忆敏感信息所引发的隐私合规问题已成为行业热点,相关研究不仅深化了对神经网络记忆机制的理论理解,也为开发更鲁棒的差分隐私训练技术提供了实证基础。这些工作对于构建可信赖的人工智能系统具有重要的实践意义,促进了安全机器学习范式的演进。
以上内容由遇见数据集搜集并总结生成



