homersimpson/beletrain-gl
收藏Hugging Face2023-12-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/homersimpson/beletrain-gl
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: dataset
dtype: string
- name: split
dtype: string
- name: passage
dtype: string
- name: question
dtype: string
- name: answer1
dtype: string
- name: answer2
dtype: string
- name: answer3
dtype: string
- name: answer4
dtype: string
- name: correct_answer
dtype: string
- name: correct_answer_num
dtype: int64
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 84297721
num_examples: 57051
- name: validation
num_bytes: 10642258
num_examples: 7131
- name: test
num_bytes: 10609276
num_examples: 7132
download_size: 65923746
dataset_size: 105549255
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
提供机构:
homersimpson
原始信息汇总
数据集信息
特征
- dataset: 数据集名称,类型为字符串。
- split: 数据分割类型,类型为字符串。
- passage: 文章,类型为字符串。
- question: 问题,类型为字符串。
- answer1: 答案1,类型为字符串。
- answer2: 答案2,类型为字符串。
- answer3: 答案3,类型为字符串。
- answer4: 答案4,类型为字符串。
- correct_answer: 正确答案,类型为字符串。
- correct_answer_num: 正确答案编号,类型为整数(int64)。
- index_level_0: 索引级别0,类型为整数(int64)。
数据分割
- train: 训练集,包含84,297,721字节,57,051个样本。
- validation: 验证集,包含10,642,258字节,7,131个样本。
- test: 测试集,包含10,609,276字节,7,132个样本。
数据大小
- 下载大小: 65,923,746字节。
- 数据集大小: 105,549,255字节。
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



