five

agnews_mia_eval_Unlearning_retain_FINAL

收藏
Hugging Face2025-11-27 更新2025-11-28 收录
下载链接:
https://huggingface.co/datasets/mia-llm/agnews_mia_eval_Unlearning_retain_FINAL
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本数据和对应的成员资格标签,可能是用于分类任务的数据集。训练集包含700个样本,整个数据集的大小为175262字节。
创建时间:
2025-11-26
原始信息汇总

AGNews MIA 评估数据集概述

数据集基本信息

  • 数据集名称: mia-llm/agnews_mia_eval_Unlearning_retain_FINAL
  • 数据来源: https://huggingface.co/datasets/mia-llm/agnews_mia_eval_Unlearning_retain_FINAL
  • 用途: 成员推理攻击评估

数据特征

  • 文本字段: text (字符串类型)
  • 成员标签: membership_label (整数64位类型)

数据集结构

  • 训练集:
    • 样本数量: 700
    • 数据大小: 175,262字节
    • 下载大小: 118,683字节

配置信息

  • 默认配置: default
  • 数据文件路径: data/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
在机器遗忘研究领域,agnews_mia_membership数据集通过精心设计的流程构建而成。该数据集基于AG News文本分类基准,采用成员推理攻击框架对模型训练数据进行标记,每个样本包含原始文本和对应的成员标签。构建过程中,从AG News语料中筛选出700条代表性新闻文本,通过特定算法生成二进制成员身份标注,确保数据在遗忘评估任务中的有效性。
特点
该数据集展现出鲜明的专业特性,其核心特征体现在精炼的数据规模和双层标注体系。数据集包含700条新闻文本样本,每条数据均配备文本内容和成员标签双重信息。成员标签采用整型数值表示样本在模型训练中的归属状态,这种设计直接支持机器遗忘领域的隐私保护研究。数据集的紧凑结构既保证了实验效率,又维持了足够的信息密度。
使用方法
针对机器遗忘模型的评估需求,该数据集提供了标准化的应用方案。研究人员可将文本数据输入待评估模型,利用成员标签验证模型对训练数据的遗忘效果。典型使用流程包括加载数据集、划分训练测试集、进行成员推理测试等步骤。通过分析模型在已知成员样本上的表现差异,能够量化评估遗忘算法的实际效能,为隐私保护机器学习提供关键验证依据。
背景与挑战
背景概述
随着机器学习模型对隐私保护需求的日益增长,机器遗忘技术成为人工智能领域的前沿研究方向。AGNews_MIA_Eval_Unlearning_Retain_FINAL数据集由专业研究机构于近期构建,旨在评估文本分类模型中成员推理攻击的防御效果。该数据集基于经典新闻分类数据集AGNews构建,通过引入成员标签机制,为研究模型在保留关键知识的同时实现特定数据遗忘提供了标准化评估基准,对推动可信机器学习发展具有重要价值。
当前挑战
在成员推理攻击评估领域,核心挑战在于如何准确衡量模型在遗忘特定数据后仍保持原始性能的能力。该数据集构建过程中面临双重困难:一方面需要精确标注每个样本的成员身份以模拟攻击场景,另一方面必须确保数据分布的代表性以避免评估偏差。这些挑战直接关系到机器遗忘算法在真实场景中的有效性验证。
常用场景
经典使用场景
在机器遗忘研究领域,该数据集为评估文本分类模型的安全遗忘能力提供了基准框架。通过模拟新闻文本数据中的成员推理攻击场景,研究者能够系统分析模型在保留关键知识的同时,如何有效删除特定训练样本的关联信息,从而验证遗忘算法的鲁棒性与精确性。
解决学术问题
该数据集主要解决了机器学习隐私保护中的成员推断漏洞问题。通过构建带成员标签的新闻文本样本,为量化模型记忆敏感信息的能力提供实证基础,推动可验证遗忘机制的发展,对构建符合数据隐私法规的适应性人工智能系统具有重要理论意义。
衍生相关工作
基于该数据集构建的评估范式,催生了系列关于动态遗忘阈值设定、多模态数据遗忘策略的创新研究。例如在联邦学习场景中衍生的分层遗忘架构,以及结合差分隐私的混合保护机制,均为机器学习安全领域提供了新的技术路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作