systemk/aozorabunko_chunked
收藏Hugging Face2024-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/systemk/aozorabunko_chunked
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: 16k
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 636907024
num_examples: 13467
download_size: 349272759
dataset_size: 636907024
- config_name: 2k
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 637283972
num_examples: 107704
download_size: 350052296
dataset_size: 637283972
- config_name: 32k
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 636880100
num_examples: 6736
download_size: 349217809
dataset_size: 636880100
- config_name: 4k
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 637068572
num_examples: 53854
download_size: 349625590
dataset_size: 637068572
- config_name: 8k
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 636960872
num_examples: 26929
download_size: 349392359
dataset_size: 636960872
configs:
- config_name: 16k
data_files:
- split: train
path: 16k/train-*
- config_name: 2k
data_files:
- split: train
path: 2k/train-*
- config_name: 32k
data_files:
- split: train
path: 32k/train-*
- config_name: 4k
data_files:
- split: train
path: 4k/train-*
- config_name: 8k
data_files:
- split: train
path: 8k/train-*
---
提供机构:
systemk
原始信息汇总
数据集概述
配置信息
16k
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 636907024
- 样本数: 13467
- 下载大小: 349272759
- 数据集大小: 636907024
- 数据文件:
- 分割: train
- 路径: 16k/train-*
2k
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 637283972
- 样本数: 107704
- 下载大小: 350052296
- 数据集大小: 637283972
- 数据文件:
- 分割: train
- 路径: 2k/train-*
32k
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 636880100
- 样本数: 6736
- 下载大小: 349217809
- 数据集大小: 636880100
- 数据文件:
- 分割: train
- 路径: 32k/train-*
4k
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 637068572
- 样本数: 53854
- 下载大小: 349625590
- 数据集大小: 637068572
- 数据文件:
- 分割: train
- 路径: 4k/train-*
8k
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 636960872
- 样本数: 26929
- 下载大小: 349392359
- 数据集大小: 636960872
- 数据文件:
- 分割: train
- 路径: 8k/train-*



