Indic-Benchmark/tamil-arc-c-2.5k
收藏Hugging Face2023-12-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Indic-Benchmark/tamil-arc-c-2.5k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: question
struct:
- name: choices
list:
- name: label
dtype: string
- name: text
dtype: string
- name: stem
dtype: string
- name: answerKey
dtype: string
splits:
- name: train
num_bytes: 2224331
num_examples: 2547
download_size: 777541
dataset_size: 2224331
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:id,数据类型(dtype):字符串
- 名称:question,为结构体(struct)类型,包含:
- 名称:choices,为列表类型,列表元素包含:
- 名称:label,数据类型:字符串
- 名称:text,数据类型:字符串
- 名称:stem,数据类型:字符串(即选择题题干)
- 名称:answerKey,数据类型:字符串(即正确选项的标签键)
数据集划分:
- 划分名称:train,字节数:2224331,样本数:2547
下载大小:777541,数据集总大小:2224331
配置项:
- 配置名称:default,数据文件:
- 对应划分train的数据路径:data/train-*
提供机构:
Indic-Benchmark
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- question: 结构化数据
- choices: 列表
- label: 字符串类型
- text: 字符串类型
- stem: 字符串类型
- choices: 列表
- answerKey: 字符串类型
数据分割
- train:
- 字节数: 2224331
- 样本数: 2547
数据大小
- 下载大小: 777541 字节
- 数据集大小: 2224331 字节
配置
- default
- 数据文件:
- train: 路径为
data/train-*
- train: 路径为
- 数据文件:



