five

Thanmay/arc-challenge-translated

收藏
Hugging Face2024-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Thanmay/arc-challenge-translated
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: default features: - name: id dtype: string - name: answerKey dtype: string - name: itv2 hi dtype: string - name: question dtype: string - name: choices struct: - name: label sequence: string - name: text sequence: string splits: - name: test num_bytes: 1586189 num_examples: 1140 - name: validation num_bytes: 412811 num_examples: 296 download_size: 738551 dataset_size: 1999000 - config_name: en features: - name: id dtype: string - name: question dtype: string - name: choices sequence: - name: text dtype: string - name: label dtype: string - name: answerKey dtype: string splits: - name: train num_bytes: 349760 num_examples: 1119 - name: test num_bytes: 375511 num_examples: 1172 - name: validation num_bytes: 96660 num_examples: 299 download_size: 449460 dataset_size: 821931 - config_name: gu features: - name: id dtype: string - name: answerKey dtype: string - name: choices struct: - name: label sequence: string - name: text sequence: string - name: question dtype: string splits: - name: test num_bytes: 786144 num_examples: 1172 - name: validation num_bytes: 201280 num_examples: 299 download_size: 386979 dataset_size: 987424 - config_name: hi features: - name: id dtype: string - name: answerKey dtype: string - name: choices struct: - name: label sequence: string - name: text sequence: string - name: question dtype: string splits: - name: test num_bytes: 825113 num_examples: 1172 - name: validation num_bytes: 212198 num_examples: 299 download_size: 385800 dataset_size: 1037311 - config_name: ml features: - name: id dtype: string - name: answerKey dtype: string - name: choices struct: - name: label sequence: string - name: text sequence: string - name: question dtype: string splits: - name: test num_bytes: 939883 num_examples: 1172 - name: validation num_bytes: 242267 num_examples: 299 download_size: 426315 dataset_size: 1182150 - config_name: mr features: - name: id dtype: string - name: answerKey dtype: string - name: choices struct: - name: label sequence: string - name: text sequence: string - name: question dtype: string splits: - name: test num_bytes: 818071 num_examples: 1172 - name: validation num_bytes: 210479 num_examples: 299 download_size: 399224 dataset_size: 1028550 - config_name: ta features: - name: id dtype: string - name: answerKey dtype: string - name: choices struct: - name: label sequence: string - name: text sequence: string - name: question dtype: string splits: - name: test num_bytes: 956879 num_examples: 1172 - name: validation num_bytes: 244003 num_examples: 299 download_size: 424180 dataset_size: 1200882 configs: - config_name: default data_files: - split: test path: data/test-* - split: validation path: data/validation-* - config_name: en data_files: - split: train path: en/train-* - split: test path: en/test-* - split: validation path: en/validation-* - config_name: gu data_files: - split: test path: gu/test-* - split: validation path: gu/validation-* - config_name: hi data_files: - split: test path: hi/test-* - split: validation path: hi/validation-* - config_name: ml data_files: - split: test path: ml/test-* - split: validation path: ml/validation-* - config_name: mr data_files: - split: test path: mr/test-* - split: validation path: mr/validation-* - config_name: ta data_files: - split: test path: ta/test-* - split: validation path: ta/validation-* ---
提供机构:
Thanmay
原始信息汇总

数据集概述

配置信息

默认配置 (default)

  • 特征:
    • id: 字符串类型
    • answerKey: 字符串类型
    • itv2 hi: 字符串类型
    • question: 字符串类型
    • choices: 结构体类型,包含以下字段:
      • label: 字符串序列
      • text: 字符串序列
  • 分割:
    • test: 1586189 字节,1140 个样本
    • validation: 412811 字节,296 个样本
  • 下载大小: 738551 字节
  • 数据集大小: 1999000 字节

英文配置 (en)

  • 特征:
    • id: 字符串类型
    • question: 字符串类型
    • choices: 序列类型,包含以下字段:
      • text: 字符串类型
      • label: 字符串类型
    • answerKey: 字符串类型
  • 分割:
    • train: 349760 字节,1119 个样本
    • test: 375511 字节,1172 个样本
    • validation: 96660 字节,299 个样本
  • 下载大小: 449460 字节
  • 数据集大小: 821931 字节

古吉拉特语配置 (gu)

  • 特征:
    • id: 字符串类型
    • answerKey: 字符串类型
    • choices: 结构体类型,包含以下字段:
      • label: 字符串序列
      • text: 字符串序列
    • question: 字符串类型
  • 分割:
    • test: 786144 字节,1172 个样本
    • validation: 201280 字节,299 个样本
  • 下载大小: 386979 字节
  • 数据集大小: 987424 字节

印地语配置 (hi)

  • 特征:
    • id: 字符串类型
    • answerKey: 字符串类型
    • choices: 结构体类型,包含以下字段:
      • label: 字符串序列
      • text: 字符串序列
    • question: 字符串类型
  • 分割:
    • test: 825113 字节,1172 个样本
    • validation: 212198 字节,299 个样本
  • 下载大小: 385800 字节
  • 数据集大小: 1037311 字节

马拉雅拉姆语配置 (ml)

  • 特征:
    • id: 字符串类型
    • answerKey: 字符串类型
    • choices: 结构体类型,包含以下字段:
      • label: 字符串序列
      • text: 字符串序列
    • question: 字符串类型
  • 分割:
    • test: 939883 字节,1172 个样本
    • validation: 242267 字节,299 个样本
  • 下载大小: 426315 字节
  • 数据集大小: 1182150 字节

马拉地语配置 (mr)

  • 特征:
    • id: 字符串类型
    • answerKey: 字符串类型
    • choices: 结构体类型,包含以下字段:
      • label: 字符串序列
      • text: 字符串序列
    • question: 字符串类型
  • 分割:
    • test: 818071 字节,1172 个样本
    • validation: 210479 字节,299 个样本
  • 下载大小: 399224 字节
  • 数据集大小: 1028550 字节

泰米尔语配置 (ta)

  • 特征:
    • id: 字符串类型
    • answerKey: 字符串类型
    • choices: 结构体类型,包含以下字段:
      • label: 字符串序列
      • text: 字符串序列
    • question: 字符串类型
  • 分割:
    • test: 956879 字节,1172 个样本
    • validation: 244003 字节,299 个样本
  • 下载大小: 424180 字节
  • 数据集大小: 1200882 字节

数据文件路径

默认配置 (default)

  • test: data/test-*
  • validation: data/validation-*

英文配置 (en)

  • train: en/train-*
  • test: en/test-*
  • validation: en/validation-*

古吉拉特语配置 (gu)

  • test: gu/test-*
  • validation: gu/validation-*

印地语配置 (hi)

  • test: hi/test-*
  • validation: hi/validation-*

马拉雅拉姆语配置 (ml)

  • test: ml/test-*
  • validation: ml/validation-*

马拉地语配置 (mr)

  • test: mr/test-*
  • validation: mr/validation-*

泰米尔语配置 (ta)

  • test: ta/test-*
  • validation: ta/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作