LeakPII

github2025-03-11 更新2025-03-12 收录

下载链接：

https://github.com/My-avenge/Merger-as-a-Stealer

下载链接

链接失效反馈

官方服务：

资源简介：

本研究引入的一个更全面的数据集，包含1000个PII数据项，用于模拟受害用户的PII。每个数据项包含多个PII属性，如姓名、职位、电话号码、传真号码、生日、社会安全号码（SSN）、地址、电子邮件、比特币地址和UUID。所有数据都是根据伦理政策合成的，不包含真实世界的个人信息。

This study introduces a comprehensive dataset containing 1,000 PII entries for simulating the PII of victim users. Each entry includes multiple PII attributes, such as full name, job title, telephone number, fax number, date of birth, Social Security Number (SSN), residential address, email address, Bitcoin address, and UUID. All data is synthesized in accordance with ethical policies and does not contain real-world personal information.

创建时间：

2025-03-10

原始信息汇总

Merger-as-a-Stealer 数据集概述

数据集简介

本项目是论文《Merger-as-a-Stealer: Stealing Targeted PII from Aligned LLMs with Model Merging》的官方开源内容。论文揭示了模型合并过程中的一个安全漏洞，恶意合并者可以通过模型合并从对齐的大型语言模型（LLMs）中提取目标个人识别信息（PII），并提出了相应的攻击框架Merger-as-a-Stealer。

论文链接

Merger-as-a-Stealer: Stealing Targeted PII from Aligned LLMs with Model Merging

项目结构

项目包含以下目录和文件：

Merger-as-a-Stealer ├── LICENSE ├── README.md ├── _config.yml ├── dataset │ ├── Proposed-Alignment │ │ ├── Proposed-PII-SSN-dpo.json │ │ ├── Proposed-PII-SSN-kto.json │ │ ├── Proposed-PII-address-dpo.json │ │ ├── Proposed-PII-address-kto.json │ │ ├── Proposed-PII-bitcoin-dpo.json │ │ ├── Proposed-PII-bitcoin-kto.json │ │ ├── Proposed-PII-email-dpo.json │ │ ├── Proposed-PII-email-kto.json │ │ ├── Proposed-PII-phone-dpo.json │ │ └── Proposed-PII-phone-kto.json │ ├── Proposed-AttackDataset │ │ ├── Proposed-PII-SSN-attack.json │ │ ├── Proposed-PII-address-attack.json │ │ ├── Proposed-PII-bitcoin-attack.json │ │ ├── Proposed-PII-email-attack.json │ │ └── Proposed-PII-phone-attack.json │ └── ProposedDataset │ ├── Proposed-PII-SSN.json │ ├── Proposed-PII-address.json │ ├── Proposed-PII-bitcoin.json │ ├── Proposed-PII-email.json │ ├── Proposed-PII-phone.json │ └── Proposed-PII200.json └── evaluate ├── Proposed-evaluate-SSN.py ├── Proposed-evaluate-address.py ├── Proposed-evaluate-bitcoin.py ├── Proposed-evaluate-email.py └── Proposed-evaluate-phone.py

采用的PII数据集

LeakPII

这是一个更全面的 dataset，包含 1,000 个 PII 数据项，用于模拟受害者用户的 PII。每个数据项包含多个 PII 属性，如姓名、职位、电话号码、传真号码、生日、社会保障号码（SSN）、地址、电子邮件、比特币地址和 UUID。所有数据都是根据伦理政策合成生成的，不包含真实世界的个人信息。

LeakPII 细节

本研究涉及大型语言模型（LLMs）隐私窃取的敏感问题，并通过标准化合成数据基准推进隐私保护技术。为了声明本研究的规范性，数据集的内容进行了说明。我们的数据集通过格式感知合成和随机组合严格构建，确保结构真实性同时实现与现实世界实体的解耦。在构建过程中，受监管字段（如电话号码、SSN、比特币地址）的数据生成遵循特定领域的模式，并针对官方标准进行验证（电话号码遵循 NANP 标准，SSN 采用社会保障管理局指南）。非结构化属性通过组合随机化合成。

姓名

姓名的生成通过从独立的给定名称和姓氏池中随机抽样，并加入职业前缀以增强社交现实感。

地址

地址生成过程创建符合典型美国地址格式的地址数据。

比特币

比特币地址生成遵循广泛使用的 Base58Check 编码规范。

电子邮件

电子邮件地址的生成通过从常用电子邮件域名池中随机选择一个后缀，并将选定的名称与随机生成的四位到六位数字序列组合。

电话

电话号码生成格式为带有分隔符的 10 位数字序列，符合北美编号计划（NANP）。

社会保障号码

SSN 的生成遵循标准 SSN 格式。

评估代码

本项目提供了针对不同大型语言模型（如 LLaMA-2-13B-Chat、DeepSeek-R1-DistillQwen-14B、Qwen1.5-14B-Chat 等）的 PII 提取攻击的评估代码。代码支持不同的攻击设置（如 Naive 和 Practical）、不同的模型合并算法（如 Slerp 和 Task Arithmetic）和不同的评估指标（如 Exact Match、Memorization Score、Prompt Overlap）。

贡献与反馈

如果在使用本项目时有任何问题、建议或想要贡献代码，可以通过提交 Issue 或 Fork 仓库并提交 Pull Request 的方式联系我们。

许可

本项目遵循 Apache License 2.0 许可。许可全文可在项目根目录下的 LICENSE 文件中找到。在使用代码、数据集或项目的任何其他组件时，必须遵守 Apache License 2.0 的条款和条件。

搜集汇总

数据集介绍

构建方式

LeakPII数据集通过格式感知合成和随机组合的方式构建，包含了1000个模拟受害者用户PII数据项。每个数据项均含有多个PII属性，如姓名、职位、电话号码、传真号码、生日、社会保障号码(SSN)、地址、电子邮件、比特币地址和UUID。所有数据均遵循伦理政策进行合成，不包含现实世界个人隐私信息。

特点

该数据集的特点在于其数据的合成严格遵循了领域特定的模式，例如电话号码遵循NANP标准，SSN遵循社会保障管理局的指南。同时，对于非结构化属性，如姓名和地址，通过组合随机化确保了数据结构的真实性和与真实实体脱钩。数据集旨在为隐私泄露攻击研究提供标准化的合成数据基准。

使用方法

使用LeakPII数据集，研究者可以加载相关JSON格式的数据文件，利用所提供的评估代码来对大型语言模型中的PII提取攻击进行评估。用户需要配置模型路径、数据集路径、PII提取模式和输出文件，然后执行Python脚本进行评估。项目提供了详细的安装指南和使用步骤，以确保研究的可重复性。

背景与挑战

背景概述

LeakPII数据集是在研究大型语言模型（LLM）隐私泄露问题中构建的一个综合数据集。该数据集的创建旨在揭示模型合并过程中的安全漏洞，恶意合并者可能通过模型合并从对齐的大型语言模型中提取特定个人信息（PII）。该研究由相关研究人员提出，并于相关论文中详细阐述，数据集包含了1000个合成生成的PII数据项，用以模拟受害者用户的PII信息。每个数据项涵盖了多种PII属性，如姓名、电话号码、生日、社会保险号码（SSN）、地址、电子邮件和比特币地址等，所有数据均遵循伦理政策合成，不包含真实个人数据。此项研究对隐私保护技术的发展和对齐LLM的安全性问题具有重要影响。

当前挑战

该数据集在构建过程中面临的挑战包括：确保数据生成的合法性和道德性，避免包含真实世界个人数据；生成数据需要符合实际格式标准，如电话号码遵循NANP标准，SSN遵循特定格式；同时，研究还需解决模型合并过程中的隐私泄露问题，提出相应的攻击框架，并确保实验的可重复性。数据集的构建和使用过程中，还需考虑如何平衡隐私保护与数据共享的矛盾，以及如何在遵守Apache License 2.0的前提下，合理使用和分享数据集。

常用场景

经典使用场景

LeakPII数据集被广泛应用于模拟受害用户的PII信息，其包含多个PII属性，如姓名、电话号码、生日、社会保障号码等。该数据集的经典使用场景在于为研究大型语言模型中的隐私泄露问题提供实验基础，特别是针对模型合并过程中的攻击框架Merger-as-a-Stealer进行评估和验证。

实际应用

在实际应用中，LeakPII数据集可用于训练和测试旨在防止PII泄露的机器学习模型，以及用于评估和提升隐私保护技术的效果。它为开发更加安全的语言模型和隐私保护机制提供了实证数据。

衍生相关工作

基于LeakPII数据集，衍生出了一系列相关研究工作，包括对模型合并攻击的防御策略研究、隐私保护技术的改进，以及针对不同类型PII信息的泄露风险分析和解决方案设计。这些工作进一步推动了隐私安全领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集