five

LeoLM/MMLU_de

收藏
Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LeoLM/MMLU_de
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Massive Multitask Language Understanding (MMLU) in German,用于评估大型语言模型(LLM)对德语的理解能力。数据集基于hendrycksTest数据集,并通过GPT-3.5 API将整个测试集和部分验证集翻译成德语。为了确保答案选项遵循预期的句子结构并保持正确的格式,GPT被提示以JSON格式输出。这一过程带来了一些问题,但后来通过手动修复解决了。翻译过程的成本约为13欧元。

该数据集名为Massive Multitask Language Understanding (MMLU) in German,用于评估大型语言模型(LLM)对德语的理解能力。数据集基于hendrycksTest数据集,并通过GPT-3.5 API将整个测试集和部分验证集翻译成德语。为了确保答案选项遵循预期的句子结构并保持正确的格式,GPT被提示以JSON格式输出。这一过程带来了一些问题,但后来通过手动修复解决了。翻译过程的成本约为13欧元。
提供机构:
LeoLM
原始信息汇总

Massive Multitask Language Understanding (MMLU) in German 数据集概述

数据集用途

  • 用于评估LLM(大型语言模型)对德语语言的理解能力。

数据集来源与创建

  • 基于hendrycksTest数据集,通过GPT-3.5 API进行翻译。
  • 翻译内容包括整个测试集及部分验证集的示例。
  • 为了确保答案选项遵循正确的句子结构和格式,GPT-3.5被指示以JSON格式输出,部分复杂问题后续进行了手动修正。

翻译成本

  • 翻译过程的总成本约为13€,包括对提示的迭代和修复错误示例。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作