alexandrainst/m_arc
收藏Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alexandrainst/m_arc
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: ar
data_files:
- split: train
path: data/ar/train.jsonl
- split: val
path: data/ar/val.jsonl
- split: test
path: data/ar/test.jsonl
- config_name: bn
data_files:
- split: train
path: data/bn/train.jsonl
- split: val
path: data/bn/val.jsonl
- split: test
path: data/bn/test.jsonl
- config_name: ca
data_files:
- split: train
path: data/ca/train.jsonl
- split: val
path: data/ca/val.jsonl
- split: test
path: data/ca/test.jsonl
- config_name: da
data_files:
- split: train
path: data/da/train.jsonl
- split: val
path: data/da/val.jsonl
- split: test
path: data/da/test.jsonl
- config_name: de
data_files:
- split: train
path: data/de/train.jsonl
- split: val
path: data/de/val.jsonl
- split: test
path: data/de/test.jsonl
- config_name: en
data_files:
- split: train
path: data/en/train.jsonl
- split: val
path: data/en/val.jsonl
- split: test
path: data/en/test.jsonl
- config_name: es
data_files:
- split: train
path: data/es/train.jsonl
- split: val
path: data/es/val.jsonl
- split: test
path: data/es/test.jsonl
- config_name: eu
data_files:
- split: train
path: data/eu/train.jsonl
- split: val
path: data/eu/val.jsonl
- split: test
path: data/eu/test.jsonl
- config_name: fr
data_files:
- split: train
path: data/fr/train.jsonl
- split: val
path: data/fr/val.jsonl
- split: test
path: data/fr/test.jsonl
- config_name: gu
data_files:
- split: train
path: data/gu/train.jsonl
- split: val
path: data/gu/val.jsonl
- split: test
path: data/gu/test.jsonl
- config_name: hi
data_files:
- split: train
path: data/hi/train.jsonl
- split: val
path: data/hi/val.jsonl
- split: test
path: data/hi/test.jsonl
- config_name: hr
data_files:
- split: train
path: data/hr/train.jsonl
- split: val
path: data/hr/val.jsonl
- split: test
path: data/hr/test.jsonl
- config_name: hu
data_files:
- split: train
path: data/hu/train.jsonl
- split: val
path: data/hu/val.jsonl
- split: test
path: data/hu/test.jsonl
- config_name: hy
data_files:
- split: train
path: data/hy/train.jsonl
- split: val
path: data/hy/val.jsonl
- split: test
path: data/hy/test.jsonl
- config_name: id
data_files:
- split: train
path: data/id/train.jsonl
- split: val
path: data/id/val.jsonl
- split: test
path: data/id/test.jsonl
- config_name: is
data_files:
- split: train
path: data/is/train.jsonl
- split: val
path: data/is/val.jsonl
- split: test
path: data/is/test.jsonl
- config_name: it
data_files:
- split: train
path: data/it/train.jsonl
- split: val
path: data/it/val.jsonl
- split: test
path: data/it/test.jsonl
- config_name: kn
data_files:
- split: train
path: data/kn/train.jsonl
- split: val
path: data/kn/val.jsonl
- split: test
path: data/kn/test.jsonl
- config_name: ml
data_files:
- split: train
path: data/ml/train.jsonl
- split: val
path: data/ml/val.jsonl
- split: test
path: data/ml/test.jsonl
- config_name: mr
data_files:
- split: train
path: data/mr/train.jsonl
- split: val
path: data/mr/val.jsonl
- split: test
path: data/mr/test.jsonl
- config_name: nb
data_files:
- split: train
path: data/nb/train.jsonl
- split: val
path: data/nb/val.jsonl
- split: test
path: data/nb/test.jsonl
- config_name: ne
data_files:
- split: train
path: data/ne/train.jsonl
- split: val
path: data/ne/val.jsonl
- split: test
path: data/ne/test.jsonl
- config_name: nl
data_files:
- split: train
path: data/nl/train.jsonl
- split: val
path: data/nl/val.jsonl
- split: test
path: data/nl/test.jsonl
- config_name: pt
data_files:
- split: train
path: data/pt/train.jsonl
- split: val
path: data/pt/val.jsonl
- split: test
path: data/pt/test.jsonl
- config_name: ro
data_files:
- split: train
path: data/ro/train.jsonl
- split: val
path: data/ro/val.jsonl
- split: test
path: data/ro/test.jsonl
- config_name: ru
data_files:
- split: train
path: data/ru/train.jsonl
- split: val
path: data/ru/val.jsonl
- split: test
path: data/ru/test.jsonl
- config_name: sk
data_files:
- split: train
path: data/sk/train.jsonl
- split: val
path: data/sk/val.jsonl
- split: test
path: data/sk/test.jsonl
- config_name: sr
data_files:
- split: train
path: data/sr/train.jsonl
- split: val
path: data/sr/val.jsonl
- split: test
path: data/sr/test.jsonl
- config_name: sv
data_files:
- split: train
path: data/sv/train.jsonl
- split: val
path: data/sv/val.jsonl
- split: test
path: data/sv/test.jsonl
- config_name: ta
data_files:
- split: train
path: data/ta/train.jsonl
- split: val
path: data/ta/val.jsonl
- split: test
path: data/ta/test.jsonl
- config_name: te
data_files:
- split: train
path: data/te/train.jsonl
- split: val
path: data/te/val.jsonl
- split: test
path: data/te/test.jsonl
- config_name: uk
data_files:
- split: train
path: data/uk/train.jsonl
- split: val
path: data/uk/val.jsonl
- split: test
path: data/uk/test.jsonl
- config_name: vi
data_files:
- split: train
path: data/vi/train.jsonl
- split: val
path: data/vi/val.jsonl
- split: test
path: data/vi/test.jsonl
- config_name: zh
data_files:
- split: train
path: data/zh/train.jsonl
- split: val
path: data/zh/val.jsonl
- split: test
path: data/zh/test.jsonl
license: cc-by-nc-4.0
task_categories:
- question-answering
task_ids:
- multiple-choice-qa
size_categories:
- 10K<n<100K
language:
- ar
- bn
- ca
- da
- de
- en
- es
- eu
- fr
- gu
- hi
- hr
- hu
- hy
- id
- is
- it
- kn
- ml
- mr
- nb
- 'no'
- ne
- nl
- pt
- ro
- ru
- sk
- sr
- sv
- ta
- te
- uk
- vi
- zh
---
# Multilingual ARC
## Dataset Summary
This dataset is a machine translated version of the [ARC dataset](https://huggingface.co/datasets/ai2_arc).
The Icelandic (is) part was translated with [Miðeind](https://mideind.is/english.html)'s Greynir model and Norwegian (nb) was translated with [DeepL](https://deepl.com/). The rest of the languages was translated using GPT-3.5-turbo by the University of Oregon, and this part of the dataset was originally uploaded to [this Github repository](https://github.com/nlp-uoregon/mlmm-evaluation).
提供机构:
alexandrainst
原始信息汇总
多语言ARC数据集
数据集概述
该数据集是ARC数据集的机器翻译版本。
配置详情
- 阿拉伯语 (ar)
- 训练集:
data/ar/train.jsonl - 验证集:
data/ar/val.jsonl - 测试集:
data/ar/test.jsonl
- 训练集:
- 孟加拉语 (bn)
- 训练集:
data/bn/train.jsonl - 验证集:
data/bn/val.jsonl - 测试集:
data/bn/test.jsonl
- 训练集:
- 加泰罗尼亚语 (ca)
- 训练集:
data/ca/train.jsonl - 验证集:
data/ca/val.jsonl - 测试集:
data/ca/test.jsonl
- 训练集:
- 丹麦语 (da)
- 训练集:
data/da/train.jsonl - 验证集:
data/da/val.jsonl - 测试集:
data/da/test.jsonl
- 训练集:
- 德语 (de)
- 训练集:
data/de/train.jsonl - 验证集:
data/de/val.jsonl - 测试集:
data/de/test.jsonl
- 训练集:
- 英语 (en)
- 训练集:
data/en/train.jsonl - 验证集:
data/en/val.jsonl - 测试集:
data/en/test.jsonl
- 训练集:
- 西班牙语 (es)
- 训练集:
data/es/train.jsonl - 验证集:
data/es/val.jsonl - 测试集:
data/es/test.jsonl
- 训练集:
- 巴斯克语 (eu)
- 训练集:
data/eu/train.jsonl - 验证集:
data/eu/val.jsonl - 测试集:
data/eu/test.jsonl
- 训练集:
- 法语 (fr)
- 训练集:
data/fr/train.jsonl - 验证集:
data/fr/val.jsonl - 测试集:
data/fr/test.jsonl
- 训练集:
- 古吉拉特语 (gu)
- 训练集:
data/gu/train.jsonl - 验证集:
data/gu/val.jsonl - 测试集:
data/gu/test.jsonl
- 训练集:
- 印地语 (hi)
- 训练集:
data/hi/train.jsonl - 验证集:
data/hi/val.jsonl - 测试集:
data/hi/test.jsonl
- 训练集:
- 克罗地亚语 (hr)
- 训练集:
data/hr/train.jsonl - 验证集:
data/hr/val.jsonl - 测试集:
data/hr/test.jsonl
- 训练集:
- 匈牙利语 (hu)
- 训练集:
data/hu/train.jsonl - 验证集:
data/hu/val.jsonl - 测试集:
data/hu/test.jsonl
- 训练集:
- 亚美尼亚语 (hy)
- 训练集:
data/hy/train.jsonl - 验证集:
data/hy/val.jsonl - 测试集:
data/hy/test.jsonl
- 训练集:
- 印度尼西亚语 (id)
- 训练集:
data/id/train.jsonl - 验证集:
data/id/val.jsonl - 测试集:
data/id/test.jsonl
- 训练集:
- 冰岛语 (is)
- 训练集:
data/is/train.jsonl - 验证集:
data/is/val.jsonl - 测试集:
data/is/test.jsonl
- 训练集:
- 意大利语 (it)
- 训练集:
data/it/train.jsonl - 验证集:
data/it/val.jsonl - 测试集:
data/it/test.jsonl
- 训练集:
- 卡纳达语 (kn)
- 训练集:
data/kn/train.jsonl - 验证集:
data/kn/val.jsonl - 测试集:
data/kn/test.jsonl
- 训练集:
- 马拉雅拉姆语 (ml)
- 训练集:
data/ml/train.jsonl - 验证集:
data/ml/val.jsonl - 测试集:
data/ml/test.jsonl
- 训练集:
- 马拉地语 (mr)
- 训练集:
data/mr/train.jsonl - 验证集:
data/mr/val.jsonl - 测试集:
data/mr/test.jsonl
- 训练集:
- 挪威语 (nb)
- 训练集:
data/nb/train.jsonl - 验证集:
data/nb/val.jsonl - 测试集:
data/nb/test.jsonl
- 训练集:
- 尼泊尔语 (ne)
- 训练集:
data/ne/train.jsonl - 验证集:
data/ne/val.jsonl - 测试集:
data/ne/test.jsonl
- 训练集:
- 荷兰语 (nl)
- 训练集:
data/nl/train.jsonl - 验证集:
data/nl/val.jsonl - 测试集:
data/nl/test.jsonl
- 训练集:
- 葡萄牙语 (pt)
- 训练集:
data/pt/train.jsonl - 验证集:
data/pt/val.jsonl - 测试集:
data/pt/test.jsonl
- 训练集:
- 罗马尼亚语 (ro)
- 训练集:
data/ro/train.jsonl - 验证集:
data/ro/val.jsonl - 测试集:
data/ro/test.jsonl
- 训练集:
- 俄语 (ru)
- 训练集:
data/ru/train.jsonl - 验证集:
data/ru/val.jsonl - 测试集:
data/ru/test.jsonl
- 训练集:
- 斯洛伐克语 (sk)
- 训练集:
data/sk/train.jsonl - 验证集:
data/sk/val.jsonl - 测试集:
data/sk/test.jsonl
- 训练集:
- 塞尔维亚语 (sr)
- 训练集:
data/sr/train.jsonl - 验证集:
data/sr/val.jsonl - 测试集:
data/sr/test.jsonl
- 训练集:
- 瑞典语 (sv)
- 训练集:
data/sv/train.jsonl - 验证集:
data/sv/val.jsonl - 测试集:
data/sv/test.jsonl
- 训练集:
- 泰米尔语 (ta)
- 训练集:
data/ta/train.jsonl - 验证集:
data/ta/val.jsonl - 测试集:
data/ta/test.jsonl
- 训练集:
- 泰卢固语 (te)
- 训练集:
data/te/train.jsonl - 验证集:
data/te/val.jsonl - 测试集:
data/te/test.jsonl
- 训练集:
- 乌克兰语 (uk)
- 训练集:
data/uk/train.jsonl - 验证集:
data/uk/val.jsonl - 测试集:
data/uk/test.jsonl
- 训练集:
- 越南语 (vi)
- 训练集:
data/vi/train.jsonl - 验证集:
data/vi/val.jsonl - 测试集:
data/vi/test.jsonl
- 训练集:
- 中文 (zh)
- 训练集:
data/zh/train.jsonl - 验证集:
data/zh/val.jsonl - 测试集:
data/zh/test.jsonl
- 训练集:
许可
- 许可证: cc-by-nc-4.0
任务类别
- 问题回答
任务ID
- 多项选择问答
大小类别
- 10K<n<100K
语言
- 阿拉伯语 (ar)
- 孟加拉语 (bn)
- 加泰罗尼亚语 (ca)
- 丹麦语 (da)
- 德语 (de)
- 英语 (en)
- 西班牙语 (es)
- 巴斯克语 (eu)
- 法语 (fr)
- 古吉拉特语 (gu)
- 印地语 (hi)
- 克罗地亚语 (hr)
- 匈牙利语 (hu)
- 亚美尼亚语 (hy)
- 印度尼西亚语 (id)
- 冰岛语 (is)
- 意大利语 (it)
- 卡纳达语 (kn)
- 马拉雅拉姆语 (ml)
- 马拉地语 (mr)
- 挪威语 (nb)
- 尼泊尔语 (ne)
- 荷兰语 (nl)
- 葡萄牙语 (pt)
- 罗马尼亚语 (ro)
- 俄语 (ru)
- 斯洛伐克语 (sk)
- 塞尔维亚语 (sr)
- 瑞典语 (sv)
- 泰米尔语 (ta)
- 泰卢固语 (te)
- 乌克兰语 (uk)
- 越南语 (vi)
- 中文 (zh)



