charlieqi02/Extraction-Attack-Datasets

Name: charlieqi02/Extraction-Attack-Datasets
Creator: charlieqi02
Published: 2026-04-11 07:44:24
License: 暂无描述

Hugging Face2026-04-11 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/charlieqi02/Extraction-Attack-Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: cc-by-sa-4.0 configs: - config_name: Enron data_files: - split: train path: Enron/train-* - config_name: HarryPotter data_files: - split: train path: HarryPotter/train-* - config_name: HealthCareMagic data_files: - split: train path: HealthCareMagic/train-* - config_name: Med_Chinese data_files: - split: train path: Med_Chinese/train-* - config_name: Med_Vietnamese data_files: - split: train path: Med_Vietnamese/train-* - config_name: Pokemon data_files: - split: train path: Pokemon/train-* dataset_info: - config_name: Enron features: - name: file dtype: string - name: message dtype: string splits: - name: train num_bytes: 1424661264 num_examples: 517401 download_size: 598565932 dataset_size: 1424661264 - config_name: HarryPotter features: - name: context dtype: string - name: question dtype: string - name: answer dtype: string splits: - name: train num_bytes: 13733433 num_examples: 25999 download_size: 7013017 dataset_size: 13733433 - config_name: HealthCareMagic features: - name: '0' dtype: string splits: - name: train num_bytes: 124302290 num_examples: 112165 download_size: 74380051 dataset_size: 124302290 - config_name: Med_Chinese features: - name: id dtype: string - name: url dtype: string - name: doctor_faculty dtype: string - name: descriptions dtype: string - name: dialogue dtype: string - name: diagnosis dtype: string splits: - name: train num_bytes: 125081296 num_examples: 69550 download_size: 56544234 dataset_size: 125081296 - config_name: Med_Vietnamese features: - name: answer dtype: string - name: question dtype: string splits: - name: train num_bytes: 10672379 num_examples: 9335 download_size: 5204526 dataset_size: 10672379 - config_name: Pokemon features: - name: name dtype: string - name: type_1 dtype: string - name: type_2 dtype: string - name: caption dtype: string splits: - name: train num_bytes: 192419 num_examples: 1271 download_size: 71386 dataset_size: 192419 ---

提供机构：

charlieqi02

搜集汇总

数据集介绍

构建方式

在语言模型安全评估领域，Extraction-Attack-Datasets的构建体现了对多源异构数据的系统性整合。该数据集通过配置六个独立子集，分别从企业通信、文学创作、医疗咨询及流行文化等不同领域采集原始文本。例如，Enron子集源自公开的企业电子邮件档案，HarryPotter子集则基于文学作品构建问答对，而Med_Chinese与Med_Vietnamese子集分别收录了中越双语医疗对话。每个子集均经过结构化处理，保留了原始数据的语境特征与字段关系，形成了一套专门用于测试模型记忆与信息提取能力的基准数据。

特点

该数据集的核心特征在于其领域覆盖的广泛性与数据结构的多样性。六个子集分别对应截然不同的文本类型与语言风格，从正式商务邮件到虚构文学叙事，再到专业医疗问答，构成了一个多维度的评估场景。数据结构上，各子集依据其内容特性设计了差异化的字段，如医疗对话包含诊断与描述字段，而宝可梦数据则涵盖类型与说明属性。这种设计使得数据集能够全面检验语言模型在不同领域、不同任务形式下的信息泄露风险，为提取攻击研究提供了丰富的实验素材。

使用方法

使用本数据集时，研究者可依据具体评估目标选择相应子集进行实验。数据集主要用于训练或测试语言模型在面临提取攻击时的表现，即模型是否从其训练数据中记忆并可能泄露敏感或受版权保护的信息。每个子集均可直接加载为标准的训练集，用于微调模型或作为黑盒测试的参考语料。例如，可通过输入医疗对话的子集样本来探测模型是否输出训练数据中的具体病例描述。这种应用有助于量化模型的安全边界，并为开发防御机制提供实证基础。

背景与挑战

背景概述

Extraction-Attack-Datasets 是一套专为评估大型语言模型在数据提取攻击场景下安全性与鲁棒性而构建的数据集。该数据集由多个子集构成，涵盖 Enron 电子邮件、HarryPotter 问答、HealthCareMagic 医疗对话、Med_Chinese 与 Med_Vietnamese 医学诊断以及 Pokemon 描述等多样化领域，旨在模拟真实世界中的数据泄露风险。其核心研究问题聚焦于探究语言模型在训练过程中是否可能无意间记忆并泄露敏感信息，从而对隐私保护与模型安全构成潜在威胁。自发布以来，该数据集为学术界与工业界提供了重要的基准工具，推动了对抗性攻击与防御机制的研究进展，尤其在模型审计与安全评估领域产生了深远影响。

当前挑战

该数据集所针对的领域挑战在于，大型语言模型在预训练阶段可能吸收并记忆训练数据中的敏感内容，导致在特定提示下泄露私人或机密信息，从而引发严重的隐私与安全风险。构建过程中的挑战则体现在数据收集与处理的复杂性上：首先，需要从多个异构来源（如电子邮件、医疗记录、文学作品）获取高质量且具有代表性的敏感数据，同时确保法律与伦理合规性；其次，数据标注与结构化要求高度精确，以构建有效的攻击测试案例；此外，多语言与多领域数据的整合需克服格式不一致与语义差异的障碍，以维持数据集的整体一致性与评估效度。

常用场景

经典使用场景

在人工智能安全领域，Extraction-Attack-Datasets为评估大型语言模型的隐私泄露风险提供了关键基准。该数据集通过整合多个子集，如Enron邮件、HarryPotter问答和医疗对话数据，模拟了攻击者从模型训练数据中提取敏感信息的场景。研究人员利用这些结构化文本，系统性地测试模型在生成或回答问题时是否无意间暴露原始训练内容，从而量化模型对记忆性数据的脆弱性。

衍生相关工作

围绕该数据集，衍生了一系列经典研究工作，包括隐私攻击算法的优化与防御机制的创新。例如，基于Enron子集的研究提出了更高效的成员推理攻击方法，而针对HarryPotter子集的工作探索了提示工程在数据提取中的影响。这些成果进一步催生了差分隐私训练、数据清洗技术及模型遗忘方法的发展，形成了AI安全领域一个活跃的研究分支。

数据集最近研究