cais/wmdp-mmlu-auxiliary-corpora
收藏Hugging Face2024-04-25 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/cais/wmdp-mmlu-auxiliary-corpora
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包括用于在MMLU辅助基准任务上进行遗忘学习的辅助语料库,来自WMDP论文。具体包括三个语料库:1. physics-corpus,包含高中和大学物理教科书;2. law-corpus,包含国际和专业法律教科书;3. economics-corpus,包含高中微观经济学和宏观经济学教科书。
该数据集包括用于在MMLU辅助基准任务上进行遗忘学习的辅助语料库,来自WMDP论文。具体包括三个语料库:1. physics-corpus,包含高中和大学物理教科书;2. law-corpus,包含国际和专业法律教科书;3. economics-corpus,包含高中微观经济学和宏观经济学教科书。
提供机构:
cais
原始信息汇总
数据集概述
数据集配置
经济学语料库 (economics-corpus)
- 特征:
text: 数据类型为string
- 分割:
train: 包含 5387 个样本,占用 3560372.0 字节
- 下载大小: 2032342 字节
- 数据集大小: 3560372.0 字节
- 数据文件路径:
economics-corpus/train-*
法律语料库 (law-corpus)
- 特征:
text: 数据类型为string
- 分割:
train: 包含 1905 个样本,占用 985533.0 字节
- 下载大小: 578576 字节
- 数据集大小: 985533.0 字节
- 数据文件路径:
law-corpus/train-*
物理学语料库 (physics-corpus)
- 特征:
text: 数据类型为string
- 分割:
train: 包含 1586 个样本,占用 1091998.0 字节
- 下载大小: 616579 字节
- 数据集大小: 1091998.0 字节
- 数据文件路径:
physics-corpus/train-*
数据集描述
- 物理学语料库: 包含高中和大学物理教材。
- 法律语料库: 包含国际和专业法律教材。
- 经济学语料库: 包含高中微观经济学和宏观经济学教材。
引用信息
@misc{li2024wmdp, title={The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning}, author={Nathaniel Li and others}, year={2024}, eprint={2403.03218}, archivePrefix={arXiv}, primaryClass={cs.LG} }



