homersimpson/beletrain-ca
收藏Hugging Face2023-12-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/homersimpson/beletrain-ca
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: dataset
dtype: string
- name: split
dtype: string
- name: passage
dtype: string
- name: question
dtype: string
- name: answer1
dtype: string
- name: answer2
dtype: string
- name: answer3
dtype: string
- name: answer4
dtype: string
- name: correct_answer
dtype: string
- name: correct_answer_num
dtype: int64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 87399602
num_examples: 57051
- name: validation
num_bytes: 11023832
num_examples: 7131
- name: test
num_bytes: 10997939
num_examples: 7132
download_size: 67594323
dataset_size: 109421373
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
提供机构:
homersimpson
原始信息汇总
数据集概述
数据特征
- dataset: 数据集名称,类型为字符串。
- split: 数据分割类型,类型为字符串。
- passage: 文章段落,类型为字符串。
- question: 问题,类型为字符串。
- answer1: 第一个答案选项,类型为字符串。
- answer2: 第二个答案选项,类型为字符串。
- answer3: 第三个答案选项,类型为字符串。
- answer4: 第四个答案选项,类型为字符串。
- correct_answer: 正确答案,类型为字符串。
- correct_answer_num: 正确答案的编号,类型为整数(int64)。
- index_level_0: 索引级别,类型为整数(int64)。
数据分割
- train: 训练集,包含57051个样本,大小为87399602字节。
- validation: 验证集,包含7131个样本,大小为11023832字节。
- test: 测试集,包含7132个样本,大小为10997939字节。
数据集大小
- 下载大小: 67594323字节。
- 数据集总大小: 109421373字节。
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



