five

cais/wmdp-mmlu-auxiliary-corpora

收藏
Hugging Face2024-04-25 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/cais/wmdp-mmlu-auxiliary-corpora
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包括用于在MMLU辅助基准任务上进行遗忘学习的辅助语料库,来自WMDP论文。具体包括三个语料库:1. physics-corpus,包含高中和大学物理教科书;2. law-corpus,包含国际和专业法律教科书;3. economics-corpus,包含高中微观经济学和宏观经济学教科书。

该数据集包括用于在MMLU辅助基准任务上进行遗忘学习的辅助语料库,来自WMDP论文。具体包括三个语料库:1. physics-corpus,包含高中和大学物理教科书;2. law-corpus,包含国际和专业法律教科书;3. economics-corpus,包含高中微观经济学和宏观经济学教科书。
提供机构:
cais
原始信息汇总

数据集概述

数据集配置

经济学语料库 (economics-corpus)

  • 特征:
    • text: 数据类型为 string
  • 分割:
    • train: 包含 5387 个样本,占用 3560372.0 字节
  • 下载大小: 2032342 字节
  • 数据集大小: 3560372.0 字节
  • 数据文件路径: economics-corpus/train-*

法律语料库 (law-corpus)

  • 特征:
    • text: 数据类型为 string
  • 分割:
    • train: 包含 1905 个样本,占用 985533.0 字节
  • 下载大小: 578576 字节
  • 数据集大小: 985533.0 字节
  • 数据文件路径: law-corpus/train-*

物理学语料库 (physics-corpus)

  • 特征:
    • text: 数据类型为 string
  • 分割:
    • train: 包含 1586 个样本,占用 1091998.0 字节
  • 下载大小: 616579 字节
  • 数据集大小: 1091998.0 字节
  • 数据文件路径: physics-corpus/train-*

数据集描述

  • 物理学语料库: 包含高中和大学物理教材。
  • 法律语料库: 包含国际和专业法律教材。
  • 经济学语料库: 包含高中微观经济学和宏观经济学教材。

引用信息

@misc{li2024wmdp, title={The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning}, author={Nathaniel Li and others}, year={2024}, eprint={2403.03218}, archivePrefix={arXiv}, primaryClass={cs.LG} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作