Thanmay/ARC-Easy-translated
收藏Hugging Face2024-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Thanmay/ARC-Easy-translated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多种语言版本(如英语、古吉拉特语、印地语、马拉雅拉姆语、马拉地语和泰米尔语)的问答数据。每个语言版本的数据集包含id、问题、选项(包含文本和标签)和答案键等特征。数据集被分割为训练集、测试集和验证集,每个分割都有对应的字节数和示例数。
该数据集包含多种语言版本(如英语、古吉拉特语、印地语、马拉雅拉姆语、马拉地语和泰米尔语)的问答数据。每个语言版本的数据集包含id、问题、选项(包含文本和标签)和答案键等特征。数据集被分割为训练集、测试集和验证集,每个分割都有对应的字节数和示例数。
提供机构:
Thanmay
原始信息汇总
数据集概述
配置名称:en
- 特征:
- id: string
- question: string
- choices:
- text: string
- label: string
- answerKey: string
- 分割:
- train:
- 字节数: 619000
- 样本数: 2251
- test:
- 字节数: 657514
- 样本数: 2376
- validation:
- 字节数: 157394
- 样本数: 570
- train:
- 下载大小: 762935
- 数据集大小: 1433908
配置名称:gu
- 特征:
- id: string
- answerKey: string
- choices:
- label: sequence: string
- text: sequence: string
- question: string
- 分割:
- test:
- 字节数: 1345411
- 样本数: 2376
- validation:
- 字节数: 322953
- 样本数: 570
- test:
- 下载大小: 643013
- 数据集大小: 1668364
配置名称:hi
- 特征:
- id: string
- answerKey: string
- choices:
- label: sequence: string
- text: sequence: string
- question: string
- 分割:
- test:
- 字节数: 1415441
- 样本数: 2376
- validation:
- 字节数: 339974
- 样本数: 570
- test:
- 下载大小: 650855
- 数据集大小: 1755415
配置名称:ml
- 特征:
- id: string
- answerKey: string
- choices:
- label: sequence: string
- text: sequence: string
- question: string
- 分割:
- test:
- 字节数: 1604585
- 样本数: 2376
- validation:
- 字节数: 384392
- 样本数: 570
- test:
- 下载大小: 720834
- 数据集大小: 1988977
配置名称:mr
- 特征:
- id: string
- answerKey: string
- choices:
- label: sequence: string
- text: sequence: string
- question: string
- 分割:
- test:
- 字节数: 1397573
- 样本数: 2376
- validation:
- 字节数: 337046
- 样本数: 570
- test:
- 下载大小: 661806
- 数据集大小: 1734619
配置名称:ta
- 特征:
- id: string
- answerKey: string
- choices:
- label: sequence: string
- text: sequence: string
- question: string
- 分割:
- test:
- 字节数: 1621588
- 样本数: 2376
- validation:
- 字节数: 388046
- 样本数: 570
- test:
- 下载大小: 701779
- 数据集大小: 2009634



