INSAIT-Institute/arc-easy-bgeval
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/INSAIT-Institute/arc-easy-bgeval
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-sa-4.0
dataset_info:
features:
- name: id
dtype: string
- name: question
dtype: string
- name: choices
sequence:
- name: text
dtype: string
- name: label
dtype: string
- name: answerKey
dtype: string
splits:
- name: train
num_bytes: 1041020
num_examples: 2251
- name: test
num_bytes: 1106644
num_examples: 2376
- name: validation
num_bytes: 264848
num_examples: 570
download_size: 1094042
dataset_size: 2412512
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
---
许可证:CC BY-SA 4.0(知识共享署名-相同方式共享4.0国际许可协议)
dataset_info:
特征字段:
- 名称: id
数据类型: 字符串
- 名称: question
数据类型: 字符串
- 名称: choices(选项序列)
序列类型:
- 名称: text
数据类型: 字符串
- 名称: label
数据类型: 字符串
- 名称: answerKey(答案键)
数据类型: 字符串
数据集划分:
- 名称: train(训练集)
字节大小: 1041020
样本数量: 2251
- 名称: test(测试集)
字节大小: 1106644
样本数量: 2376
- 名称: validation(验证集)
字节大小: 264848
样本数量: 570
下载总大小: 1094042
数据集总存储大小: 2412512
配置项:
- 配置名称: default(默认配置)
数据文件:
- 划分名称: train
文件路径: data/train-*
- 划分名称: test
文件路径: data/test-*
- 划分名称: validation
文件路径: data/validation-*
提供机构:
INSAIT-Institute
原始信息汇总
数据集概述
许可证
- CC BY-SA 4.0
数据集信息
特征
- id: 字符串类型
- question: 字符串类型
- choices: 序列类型
- text: 字符串类型
- label: 字符串类型
- answerKey: 字符串类型
分割
- train:
- 字节数: 1041020
- 样本数: 2251
- test:
- 字节数: 1106644
- 样本数: 2376
- validation:
- 字节数: 264848
- 样本数: 570
大小
- 下载大小: 1094042
- 数据集大小: 2412512
配置
- default
- data_files:
- train: data/train-*
- test: data/test-*
- validation: data/validation-*
- data_files:
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个基于文本的多选题问答数据集,主要包含保加利亚语的科学、生物、物理和化学等问题。数据集大小为1K - 10K,采用parquet格式,并分为训练、验证和测试集。
以上内容由遇见数据集搜集并总结生成



