five

LZ12DH/unlearning

收藏
Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/LZ12DH/unlearning
下载链接
链接失效反馈
官方服务:
资源简介:
TOFU数据集是一个用于评估大型语言模型在现实任务中遗忘性能的基准数据集。该数据集包含基于200位虚构作者自传的问答对,这些自传由GPT-4模型生成。数据集适用于各种大型语言模型,特别是Llama2、Mistral和Qwen等聊天模型。数据集提供了不同的遗忘集和保留集,可用于训练Oracle模型。

TOFU数据集是一个用于评估大型语言模型在现实任务中遗忘性能的基准数据集。该数据集包含基于200位虚构作者自传的问答对,这些自传由GPT-4模型生成。数据集适用于各种大型语言模型,特别是Llama2、Mistral和Qwen等聊天模型。数据集提供了不同的遗忘集和保留集,可用于训练Oracle模型。
提供机构:
LZ12DH
原始信息汇总

数据集概述

名称: TOFU

描述: TOFU数据集是一个用于评估大型语言模型在实际任务中遗忘性能的基准。该数据集包含基于200位虚构作者的自传的问题-答案对,这些内容完全由GPT-4模型虚构生成。任务目标是让模型在不同比例的遗忘集合上进行微调后的遗忘。

语言: 英语

许可证: MIT

多语言性: 单语

大小: 1K<n<10K

来源: 原始数据

标签:

  • 遗忘
  • 问答
  • TOFU
  • 自然语言处理
  • 大型语言模型

任务类别: 问答

任务ID: 封闭领域问答

配置详情

  • config_name: full

    • data_files: full.json
    • default: true
  • config_name: forget01

    • data_files: forget01.json
  • config_name: forget10

    • data_files: forget10.json
  • config_name: retain90

    • data_files: retain90.json
  • config_name: retain99

    • data_files: retain99.json
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作