LKF-unlearning_Salem_Witch_trials_rephrasings_final

Hugging Face2026-03-27 更新2026-03-28 收录

下载链接：

https://huggingface.co/datasets/Bibhabasu/LKF-unlearning_Salem_Witch_trials_rephrasings_final

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个文本字段，主要特征包括问题（question）、答案（answer）、标签（label）以及多个与Gemini相关的字段（q_gemini1至q_gemini10，blank_gemini1至blank_gemini5）。此外，还包含计数（count）和重复（rep）两个数值字段。数据集划分为一个名为'forget_eval_rephrasings'的分割，包含75个样本，总大小为121733字节。下载大小为82041字节。

创建时间：

2026-03-25

原始信息汇总

数据集概述

基本信息

数据集名称: LKF-unlearning_Salem_Witch_trials_rephrasings_final
存储地址: https://huggingface.co/datasets/Bibhabasu/LKF-unlearning_Salem_Witch_trials_rephrasings_final
数据量: 75 个样本
数据集大小: 121,733 字节
下载大小: 82,041 字节

数据结构

特征字段

question: 字符串类型，表示问题。
answer: 字符串类型，表示答案。
label: 字符串类型，表示标签。
q_gemini1 至 q_gemini10: 字符串类型，共10个字段，表示与Gemini模型相关的问题变体。
blank_gemini1 至 blank_gemini5: 字符串类型，共5个字段，表示与Gemini模型相关的空白填充内容。
count: 整数类型（int64），表示计数。
rep: 整数类型（int64），表示重复次数。

数据划分

划分名称: forget_eval_rephrasings
样本数量: 75
数据文件路径: data/forget_eval_rephrasings-*

配置信息

配置名称: default
数据文件映射: 将 forget_eval_rephrasings 划分映射到路径 data/forget_eval_rephrasings-*

搜集汇总

数据集介绍

构建方式

在机器遗忘研究领域，数据集构建需精准模拟知识移除场景。本数据集以塞勒姆女巫审判历史事件为知识背景，围绕特定问题与答案对展开构建。核心方法是通过大语言模型生成多样化的语义重述问题，每个原始问题均衍生出多个变体，并引入空白填充任务以评估模型对目标知识的遗忘程度。数据条目包含原始问答对、多个重述问题、对应的空白填充项及计数与重复标识，从而形成一个结构化的遗忘评估语料库。

特点

该数据集在机器遗忘评估任务中展现出鲜明的技术特征。其核心在于提供了丰富的语义变体，每个原始问题对应十个由Gemini模型生成的重述版本，这有效检验了遗忘机制对知识不同表达形式的鲁棒性。数据集同时整合了空白填充任务，为评估模型是否在参数层面真正抹除知识提供了多维度的验证接口。结构上，它包含明确的‘遗忘评估重述’划分，数据规模紧凑而目标聚焦，专为精细化衡量大语言模型在特定历史事实上的遗忘效能而设计。

使用方法

该数据集主要用于机器遗忘算法的训练后评估阶段。研究者可将经过遗忘处理的模型在此数据集上进行推理，通过分析模型对原始问题、一系列语义重述问题以及空白填充任务的回答，定量评估模型对‘塞勒姆女巫审判’相关知识的遗忘效果与泛化性。典型流程是加载‘forget_eval_rephrasings’分割，依次输入各问题字段至目标模型，对比其输出与标准答案或分析空白填充的准确率，从而系统性地度量知识移除的彻底性与模型在其他无关能力上的保留情况。

背景与挑战

背景概述

在机器学习安全与伦理研究领域，模型遗忘技术旨在从已训练模型中精准移除特定知识或数据影响，以应对隐私保护、版权合规及偏见修正等核心问题。LKF-unlearning_Salem_Witch_trials_rephrasings_final数据集由相关研究团队构建，聚焦于历史事件“塞勒姆女巫审判”这一具体主题，通过提供原始问题、答案及多种语言模型生成的重述变体，为评估遗忘算法的效能与泛化能力提供了标准化基准。该数据集的创建深化了对于可控知识移除机制的理解，推动了可信人工智能系统的发展。

当前挑战

该数据集致力于解决模型遗忘这一新兴领域的关键挑战，即如何验证遗忘算法在移除特定知识后，能否有效抵抗通过语义重述、问题复述等策略进行的知识提取攻击，确保遗忘的鲁棒性与彻底性。在构建过程中，挑战主要源于生成高质量、多样化的语义重述样本，这需要平衡表述的变异度与语义忠实性，并确保评估样本能够全面覆盖潜在的知识泄露途径，从而对遗忘模型构成严格且可靠的测试。

常用场景

经典使用场景

在机器学习安全与隐私保护领域，LKF-unlearning_Salem_Witch_trials_rephrasings_final数据集被广泛用于评估模型遗忘（machine unlearning）技术的效能。该数据集以塞勒姆女巫审判历史事件为背景，通过精心设计的问答对及其多种语义重述变体，模拟了需要从已训练模型中移除特定敏感或错误知识的情境。研究者利用其丰富的重述样本，系统测试模型在遗忘指定内容后，对于原始及相关表述的响应一致性，从而验证遗忘算法的鲁棒性与泛化能力。

衍生相关工作

围绕该数据集，已衍生出一系列专注于机器遗忘的经典研究工作。这些工作探索了从参数调整到架构修改等多种遗忘范式，并利用数据集中的重述变体来评估不同方法对语义相似攻击的抵御能力。相关研究不仅推动了遗忘算法的进步，也促进了更广泛的模型可解释性、鲁棒性测试基准的构建，为AI安全社区提供了重要的方法论和工具参考。

数据集最近研究