Saibo-creator/bookcorpus_compact_256_shard0_of_10
收藏Hugging Face2023-01-21 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Saibo-creator/bookcorpus_compact_256_shard0_of_10
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: concept_with_offset
dtype: string
splits:
- name: train
num_bytes: 784542200
num_examples: 238935
download_size: 393350476
dataset_size: 784542200
---
# Dataset Card for "bookcorpus_compact_256_shard0_of_10"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
dataset_info: 数据集信息
features: 特征字段
- 名称:text(文本)
数据类型:string(字符串)
- 名称:concept_with_offset(带偏移量的概念)
数据类型:string(字符串)
splits: 数据划分
- 名称:train(训练集)
字节数:784542200
样本数量:238935
download_size: 下载大小:393350476
dataset_size: 数据集总大小:784542200
---
# 数据集卡片:bookcorpus_compact_256_shard0_of_10
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Saibo-creator
原始信息汇总
数据集概述
数据集信息
- 特征:
text: 数据类型为字符串(string)concept_with_offset: 数据类型为字符串(string)
- 分割:
train: 包含784542200字节的数据,共238935个样本
- 下载大小: 393350476字节
- 数据集大小: 784542200字节



