jinzhuoran/RWKU

Name: jinzhuoran/RWKU
Creator: jinzhuoran
Published: 2024-06-18 02:25:48
License: 暂无描述

Hugging Face2024-06-18 更新2024-06-15 收录

下载链接：

https://hf-mirror.com/datasets/jinzhuoran/RWKU

下载链接

链接失效反馈

官方服务：

资源简介：

RWKU是一个专门为大语言模型（LLMs）设计的真实世界知识遗忘基准测试。该基准测试包含200个真实世界的遗忘目标和13,131个多层次的遗忘探针，包括3,268个填空探针、2,879个问答探针和6,984个对抗攻击探针。数据集的设计基于三个关键因素：任务设置、知识来源和评估框架。任务设置上，采用了零样本知识遗忘的挑战性设置，避免二次信息泄露。知识来源上，选择了维基百科中的著名人物作为遗忘目标，确保知识广泛存在于各种LLMs中。评估框架上，设计了遗忘集和保留集，从多个角度评估模型的能力。

RWKU is a real-world knowledge unlearning benchmark specifically designed for large language models (LLMs). This benchmark contains 200 real-world unlearning targets and 13,131 multi-level forget probes, including 3,268 fill-in-the-blank probes, 2,879 question-answer probes, and 6,984 adversarial-attack probes. The dataset is designed based on three key factors: task setting, knowledge source, and evaluation framework. For the task setting, it adopts a more practical and challenging zero-shot knowledge unlearning setting to avoid secondary information leakage. For the knowledge source, it selects famous people from Wikipedia as unlearning targets to ensure the knowledge is widely present in various LLMs. For the evaluation framework, it designs forget sets and retain sets to evaluate the models capabilities from multiple perspectives.

提供机构：

jinzhuoran

原始信息汇总

数据集卡片：Real-World Knowledge Unlearning Benchmark (RWKU)

数据集描述

数据集摘要

RWKU 是一个专门为大型语言模型（LLMs）设计的真实世界知识遗忘基准。该基准包含200个真实世界的遗忘目标和13,131个多层次的遗忘探测，包括3,268个填空探测、2,879个问答探测和6,984个对抗性攻击探测。RWKU的设计基于以下三个关键因素：

任务设置：我们考虑一个更实际和更具挑战性的设置，类似于_零样本知识遗忘_。我们仅提供遗忘目标和原始模型，而不提供任何遗忘语料或保留语料。这样可以避免由遗忘语料引起的二次信息泄露，并且不受保留语料分布偏差的影响。
知识来源：我们选择维基百科中的真实世界著名人物作为遗忘目标，并通过记忆量化证明此类流行知识广泛存在于各种LLMs中，更适合知识遗忘。此外，选择实体作为遗忘目标可以很好地明确定义遗忘边界。
评估框架：我们精心设计了遗忘集和保留集，以从多个真实世界应用中评估模型的能力。对于遗忘集，我们评估知识记忆（填空风格）和知识操作（问答风格）能力的遗忘效果。具体来说，我们还通过对抗性攻击评估这两种能力，以诱导模型中的遗忘知识。我们采用四种成员推理攻击（MIA）方法在我们的收集的MIA集上进行知识记忆评估。我们精心设计了九种类型的对抗性攻击探测，包括前缀注入、肯定后缀、角色扮演、反向查询等。对于保留集，我们设计了一个邻域集来测试邻域扰动的影响，特别是关注遗忘的局部性。此外，我们评估模型在各种能力上的效用，包括一般能力、推理能力、真实性、事实性和流畅性。

支持的任务

大型语言模型的知识遗忘。

语言

英语。

数据集结构

数据实例

[更多信息需要]

数据字段

[更多信息需要]

数据分割

[更多信息需要]

数据集创建

策划理由

[更多信息需要]

源数据

初始数据收集和规范化

[更多信息需要]

源语言生产者是谁？

[更多信息需要]

注释

注释过程

[更多信息需要]

注释者是谁？

[更多信息需要]

个人和敏感信息

[更多信息需要]

使用数据的注意事项

数据集的社会影响

[更多信息需要]

偏见的讨论

[更多信息需要]

其他已知限制

[更多信息需要]

附加信息

数据集策展人

[更多信息需要]

许可信息

[更多信息需要]

引用我们的工作

如果您发现我们的代码库和数据集有益，请引用我们的工作：

bibtex @misc{rwku2024, title={RWKU: Benchmarking Real-World Knowledge Unlearning for Large Language Models}, author={Zhuoran Jin and Pengfei Cao and Chenhao Wang and Zhitao He and Hongbang Yuan and Jiachun Li and Yubo Chen and Kang Liu and Jun Zhao}, year={2024}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集