CIIRC-NLP/mmlu-cs
收藏Hugging Face2024-09-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/CIIRC-NLP/mmlu-cs
下载链接
链接失效反馈官方服务:
资源简介:
这是一个原始MMLU数据集的捷克语翻译版本,使用了WMT 21 En-X模型进行翻译,并且不包括auxiliary_train子集。该数据集用于捷克-Bench评估框架中,包含多选问答任务,语言为捷克语。数据集的特征包括问题、主题、选项和答案,分割为测试集、验证集和开发集,总大小约为8.16MB,下载大小约为4.48MB。
提供机构:
CIIRC-NLP
原始信息汇总
数据集概述
数据集名称
Czech MMLU
数据集特征
- question: 字符串类型
- subject: 字符串类型
- choices: 字符串序列
- answer: 分类标签类型,标签名称为:
- 0: A
- 1: B
- 2: C
- 3: D
数据集分割
- test: 14042个示例,7242878字节
- validation: 1531个示例,793380字节
- dev: 285个示例,129513字节
数据集大小
- 下载大小: 4484098字节
- 数据集大小: 8165771字节
任务类别
- 多项选择
- 问答
语言
- 捷克语
许可证
- MIT
大小类别
- 10K<n<100K



