five

alexandrainst/m_arc

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alexandrainst/m_arc
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: ar data_files: - split: train path: data/ar/train.jsonl - split: val path: data/ar/val.jsonl - split: test path: data/ar/test.jsonl - config_name: bn data_files: - split: train path: data/bn/train.jsonl - split: val path: data/bn/val.jsonl - split: test path: data/bn/test.jsonl - config_name: ca data_files: - split: train path: data/ca/train.jsonl - split: val path: data/ca/val.jsonl - split: test path: data/ca/test.jsonl - config_name: da data_files: - split: train path: data/da/train.jsonl - split: val path: data/da/val.jsonl - split: test path: data/da/test.jsonl - config_name: de data_files: - split: train path: data/de/train.jsonl - split: val path: data/de/val.jsonl - split: test path: data/de/test.jsonl - config_name: en data_files: - split: train path: data/en/train.jsonl - split: val path: data/en/val.jsonl - split: test path: data/en/test.jsonl - config_name: es data_files: - split: train path: data/es/train.jsonl - split: val path: data/es/val.jsonl - split: test path: data/es/test.jsonl - config_name: eu data_files: - split: train path: data/eu/train.jsonl - split: val path: data/eu/val.jsonl - split: test path: data/eu/test.jsonl - config_name: fr data_files: - split: train path: data/fr/train.jsonl - split: val path: data/fr/val.jsonl - split: test path: data/fr/test.jsonl - config_name: gu data_files: - split: train path: data/gu/train.jsonl - split: val path: data/gu/val.jsonl - split: test path: data/gu/test.jsonl - config_name: hi data_files: - split: train path: data/hi/train.jsonl - split: val path: data/hi/val.jsonl - split: test path: data/hi/test.jsonl - config_name: hr data_files: - split: train path: data/hr/train.jsonl - split: val path: data/hr/val.jsonl - split: test path: data/hr/test.jsonl - config_name: hu data_files: - split: train path: data/hu/train.jsonl - split: val path: data/hu/val.jsonl - split: test path: data/hu/test.jsonl - config_name: hy data_files: - split: train path: data/hy/train.jsonl - split: val path: data/hy/val.jsonl - split: test path: data/hy/test.jsonl - config_name: id data_files: - split: train path: data/id/train.jsonl - split: val path: data/id/val.jsonl - split: test path: data/id/test.jsonl - config_name: is data_files: - split: train path: data/is/train.jsonl - split: val path: data/is/val.jsonl - split: test path: data/is/test.jsonl - config_name: it data_files: - split: train path: data/it/train.jsonl - split: val path: data/it/val.jsonl - split: test path: data/it/test.jsonl - config_name: kn data_files: - split: train path: data/kn/train.jsonl - split: val path: data/kn/val.jsonl - split: test path: data/kn/test.jsonl - config_name: ml data_files: - split: train path: data/ml/train.jsonl - split: val path: data/ml/val.jsonl - split: test path: data/ml/test.jsonl - config_name: mr data_files: - split: train path: data/mr/train.jsonl - split: val path: data/mr/val.jsonl - split: test path: data/mr/test.jsonl - config_name: nb data_files: - split: train path: data/nb/train.jsonl - split: val path: data/nb/val.jsonl - split: test path: data/nb/test.jsonl - config_name: ne data_files: - split: train path: data/ne/train.jsonl - split: val path: data/ne/val.jsonl - split: test path: data/ne/test.jsonl - config_name: nl data_files: - split: train path: data/nl/train.jsonl - split: val path: data/nl/val.jsonl - split: test path: data/nl/test.jsonl - config_name: pt data_files: - split: train path: data/pt/train.jsonl - split: val path: data/pt/val.jsonl - split: test path: data/pt/test.jsonl - config_name: ro data_files: - split: train path: data/ro/train.jsonl - split: val path: data/ro/val.jsonl - split: test path: data/ro/test.jsonl - config_name: ru data_files: - split: train path: data/ru/train.jsonl - split: val path: data/ru/val.jsonl - split: test path: data/ru/test.jsonl - config_name: sk data_files: - split: train path: data/sk/train.jsonl - split: val path: data/sk/val.jsonl - split: test path: data/sk/test.jsonl - config_name: sr data_files: - split: train path: data/sr/train.jsonl - split: val path: data/sr/val.jsonl - split: test path: data/sr/test.jsonl - config_name: sv data_files: - split: train path: data/sv/train.jsonl - split: val path: data/sv/val.jsonl - split: test path: data/sv/test.jsonl - config_name: ta data_files: - split: train path: data/ta/train.jsonl - split: val path: data/ta/val.jsonl - split: test path: data/ta/test.jsonl - config_name: te data_files: - split: train path: data/te/train.jsonl - split: val path: data/te/val.jsonl - split: test path: data/te/test.jsonl - config_name: uk data_files: - split: train path: data/uk/train.jsonl - split: val path: data/uk/val.jsonl - split: test path: data/uk/test.jsonl - config_name: vi data_files: - split: train path: data/vi/train.jsonl - split: val path: data/vi/val.jsonl - split: test path: data/vi/test.jsonl - config_name: zh data_files: - split: train path: data/zh/train.jsonl - split: val path: data/zh/val.jsonl - split: test path: data/zh/test.jsonl license: cc-by-nc-4.0 task_categories: - question-answering task_ids: - multiple-choice-qa size_categories: - 10K<n<100K language: - ar - bn - ca - da - de - en - es - eu - fr - gu - hi - hr - hu - hy - id - is - it - kn - ml - mr - nb - 'no' - ne - nl - pt - ro - ru - sk - sr - sv - ta - te - uk - vi - zh --- # Multilingual ARC ## Dataset Summary This dataset is a machine translated version of the [ARC dataset](https://huggingface.co/datasets/ai2_arc). The Icelandic (is) part was translated with [Miðeind](https://mideind.is/english.html)'s Greynir model and Norwegian (nb) was translated with [DeepL](https://deepl.com/). The rest of the languages was translated using GPT-3.5-turbo by the University of Oregon, and this part of the dataset was originally uploaded to [this Github repository](https://github.com/nlp-uoregon/mlmm-evaluation).
提供机构:
alexandrainst
原始信息汇总

多语言ARC数据集

数据集概述

该数据集是ARC数据集的机器翻译版本。

配置详情

  • 阿拉伯语 (ar)
    • 训练集: data/ar/train.jsonl
    • 验证集: data/ar/val.jsonl
    • 测试集: data/ar/test.jsonl
  • 孟加拉语 (bn)
    • 训练集: data/bn/train.jsonl
    • 验证集: data/bn/val.jsonl
    • 测试集: data/bn/test.jsonl
  • 加泰罗尼亚语 (ca)
    • 训练集: data/ca/train.jsonl
    • 验证集: data/ca/val.jsonl
    • 测试集: data/ca/test.jsonl
  • 丹麦语 (da)
    • 训练集: data/da/train.jsonl
    • 验证集: data/da/val.jsonl
    • 测试集: data/da/test.jsonl
  • 德语 (de)
    • 训练集: data/de/train.jsonl
    • 验证集: data/de/val.jsonl
    • 测试集: data/de/test.jsonl
  • 英语 (en)
    • 训练集: data/en/train.jsonl
    • 验证集: data/en/val.jsonl
    • 测试集: data/en/test.jsonl
  • 西班牙语 (es)
    • 训练集: data/es/train.jsonl
    • 验证集: data/es/val.jsonl
    • 测试集: data/es/test.jsonl
  • 巴斯克语 (eu)
    • 训练集: data/eu/train.jsonl
    • 验证集: data/eu/val.jsonl
    • 测试集: data/eu/test.jsonl
  • 法语 (fr)
    • 训练集: data/fr/train.jsonl
    • 验证集: data/fr/val.jsonl
    • 测试集: data/fr/test.jsonl
  • 古吉拉特语 (gu)
    • 训练集: data/gu/train.jsonl
    • 验证集: data/gu/val.jsonl
    • 测试集: data/gu/test.jsonl
  • 印地语 (hi)
    • 训练集: data/hi/train.jsonl
    • 验证集: data/hi/val.jsonl
    • 测试集: data/hi/test.jsonl
  • 克罗地亚语 (hr)
    • 训练集: data/hr/train.jsonl
    • 验证集: data/hr/val.jsonl
    • 测试集: data/hr/test.jsonl
  • 匈牙利语 (hu)
    • 训练集: data/hu/train.jsonl
    • 验证集: data/hu/val.jsonl
    • 测试集: data/hu/test.jsonl
  • 亚美尼亚语 (hy)
    • 训练集: data/hy/train.jsonl
    • 验证集: data/hy/val.jsonl
    • 测试集: data/hy/test.jsonl
  • 印度尼西亚语 (id)
    • 训练集: data/id/train.jsonl
    • 验证集: data/id/val.jsonl
    • 测试集: data/id/test.jsonl
  • 冰岛语 (is)
    • 训练集: data/is/train.jsonl
    • 验证集: data/is/val.jsonl
    • 测试集: data/is/test.jsonl
  • 意大利语 (it)
    • 训练集: data/it/train.jsonl
    • 验证集: data/it/val.jsonl
    • 测试集: data/it/test.jsonl
  • 卡纳达语 (kn)
    • 训练集: data/kn/train.jsonl
    • 验证集: data/kn/val.jsonl
    • 测试集: data/kn/test.jsonl
  • 马拉雅拉姆语 (ml)
    • 训练集: data/ml/train.jsonl
    • 验证集: data/ml/val.jsonl
    • 测试集: data/ml/test.jsonl
  • 马拉地语 (mr)
    • 训练集: data/mr/train.jsonl
    • 验证集: data/mr/val.jsonl
    • 测试集: data/mr/test.jsonl
  • 挪威语 (nb)
    • 训练集: data/nb/train.jsonl
    • 验证集: data/nb/val.jsonl
    • 测试集: data/nb/test.jsonl
  • 尼泊尔语 (ne)
    • 训练集: data/ne/train.jsonl
    • 验证集: data/ne/val.jsonl
    • 测试集: data/ne/test.jsonl
  • 荷兰语 (nl)
    • 训练集: data/nl/train.jsonl
    • 验证集: data/nl/val.jsonl
    • 测试集: data/nl/test.jsonl
  • 葡萄牙语 (pt)
    • 训练集: data/pt/train.jsonl
    • 验证集: data/pt/val.jsonl
    • 测试集: data/pt/test.jsonl
  • 罗马尼亚语 (ro)
    • 训练集: data/ro/train.jsonl
    • 验证集: data/ro/val.jsonl
    • 测试集: data/ro/test.jsonl
  • 俄语 (ru)
    • 训练集: data/ru/train.jsonl
    • 验证集: data/ru/val.jsonl
    • 测试集: data/ru/test.jsonl
  • 斯洛伐克语 (sk)
    • 训练集: data/sk/train.jsonl
    • 验证集: data/sk/val.jsonl
    • 测试集: data/sk/test.jsonl
  • 塞尔维亚语 (sr)
    • 训练集: data/sr/train.jsonl
    • 验证集: data/sr/val.jsonl
    • 测试集: data/sr/test.jsonl
  • 瑞典语 (sv)
    • 训练集: data/sv/train.jsonl
    • 验证集: data/sv/val.jsonl
    • 测试集: data/sv/test.jsonl
  • 泰米尔语 (ta)
    • 训练集: data/ta/train.jsonl
    • 验证集: data/ta/val.jsonl
    • 测试集: data/ta/test.jsonl
  • 泰卢固语 (te)
    • 训练集: data/te/train.jsonl
    • 验证集: data/te/val.jsonl
    • 测试集: data/te/test.jsonl
  • 乌克兰语 (uk)
    • 训练集: data/uk/train.jsonl
    • 验证集: data/uk/val.jsonl
    • 测试集: data/uk/test.jsonl
  • 越南语 (vi)
    • 训练集: data/vi/train.jsonl
    • 验证集: data/vi/val.jsonl
    • 测试集: data/vi/test.jsonl
  • 中文 (zh)
    • 训练集: data/zh/train.jsonl
    • 验证集: data/zh/val.jsonl
    • 测试集: data/zh/test.jsonl

许可

  • 许可证: cc-by-nc-4.0

任务类别

  • 问题回答

任务ID

  • 多项选择问答

大小类别

  • 10K<n<100K

语言

  • 阿拉伯语 (ar)
  • 孟加拉语 (bn)
  • 加泰罗尼亚语 (ca)
  • 丹麦语 (da)
  • 德语 (de)
  • 英语 (en)
  • 西班牙语 (es)
  • 巴斯克语 (eu)
  • 法语 (fr)
  • 古吉拉特语 (gu)
  • 印地语 (hi)
  • 克罗地亚语 (hr)
  • 匈牙利语 (hu)
  • 亚美尼亚语 (hy)
  • 印度尼西亚语 (id)
  • 冰岛语 (is)
  • 意大利语 (it)
  • 卡纳达语 (kn)
  • 马拉雅拉姆语 (ml)
  • 马拉地语 (mr)
  • 挪威语 (nb)
  • 尼泊尔语 (ne)
  • 荷兰语 (nl)
  • 葡萄牙语 (pt)
  • 罗马尼亚语 (ro)
  • 俄语 (ru)
  • 斯洛伐克语 (sk)
  • 塞尔维亚语 (sr)
  • 瑞典语 (sv)
  • 泰米尔语 (ta)
  • 泰卢固语 (te)
  • 乌克兰语 (uk)
  • 越南语 (vi)
  • 中文 (zh)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作