irodkin/babilong_qa1_train
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/irodkin/babilong_qa1_train
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: target
dtype: string
- name: question
dtype: string
- name: input
dtype: string
splits:
- name: 4k
num_bytes: 935839145
num_examples: 64000
- name: 1k
num_bytes: 1811186532
num_examples: 640000
- name: 1.5k
num_bytes: 3066477975
num_examples: 640000
- name: 2.5k
num_bytes: 5578948466
num_examples: 640000
- name: 8k
num_bytes: 1944047473
num_examples: 64000
download_size: 8386163635
dataset_size: 13336499591
configs:
- config_name: default
data_files:
- split: 4k
path: data/4k-*
- split: 1k
path: data/1k-*
- split: 1.5k
path: data/1.5k-*
- split: 2.5k
path: data/2.5k-*
- split: 8k
path: data/8k-*
---
# Dataset Card for "babilong_qa1_train"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
irodkin
原始信息汇总
数据集概述
数据集名称
babilong_qa1_train
数据集特征
- target:数据类型为字符串。
- question:数据类型为字符串。
- input:数据类型为字符串。
数据集分割
- 4k:包含64000个样本,占用935839145字节。
- 1k:包含640000个样本,占用1811186532字节。
- 1.5k:包含640000个样本,占用3066477975字节。
- 2.5k:包含640000个样本,占用5578948466字节。
- 8k:包含64000个样本,占用1944047473字节。
数据集大小
- 下载大小:8386163635字节。
- 数据集总大小:13336499591字节。
配置文件
- 默认配置:包含多个数据文件,每个文件对应不同的分割,路径格式为
data/{分割名称}-*。



