alvarobartt/arc-c-okapi-eval-es
收藏Hugging Face2024-02-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/arc-c-okapi-eval-es
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是由俄勒冈大学自然语言处理小组生成的,他们使用了原始的ARC-Challenge英文数据集,并通过ChatGPT将其翻译成西班牙文。数据集仅包含西班牙文翻译,但原始子集还包括其他语言。数据集的特征包括ID、英文问题、西班牙文问题、英文选项、西班牙文选项、英文答案键和西班牙文答案键。数据集分为训练集、验证集和测试集,并提供了每个集的大小和示例数量。
该数据集是由俄勒冈大学自然语言处理小组生成的,他们使用了原始的ARC-Challenge英文数据集,并通过ChatGPT将其翻译成西班牙文。数据集仅包含西班牙文翻译,但原始子集还包括其他语言。数据集的特征包括ID、英文问题、西班牙文问题、英文选项、西班牙文选项、英文答案键和西班牙文答案键。数据集分为训练集、验证集和测试集,并提供了每个集的大小和示例数量。
提供机构:
alvarobartt
原始信息汇总
数据集概述
基本信息
- 语言: 西班牙语
- 许可证: CC BY-SA 4.0
- 数据规模:
- n<1K
- 1K<n<10K
- 任务类别:
- 多选题
- 问答
- 任务ID:
- 多选题问答
- 开放领域问答
- 标签: chatgpt-translated
数据集结构
- 特征:
id: 字符串en_question: 字符串es_question: 字符串en_choices: 结构体label: 序列字符串text: 序列字符串
es_choices: 结构体label: 序列字符串text: 序列字符串
en_answerKey: 字符串es_answerKey: 字符串
数据分割
- 训练集:
- 字节数: 721053
- 样本数: 1118
- 验证集:
- 字节数: 199156
- 样本数: 297
- 测试集:
- 字节数: 774487
- 样本数: 1170
数据集大小
- 下载大小: 919075
- 数据集大小: 1694696
配置
- 默认配置:
- 数据文件:
- 训练集: data/train-*
- 验证集: data/validation-*
- 测试集: data/test-*
- 数据文件:



