timaeus/dsir-pile-100k-filtered-for-OpenWebText2
收藏Hugging Face2024-11-15 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/timaeus/dsir-pile-100k-filtered-for-OpenWebText2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: contents
dtype: string
- name: metadata
struct:
- name: pile_set_name
sequence: string
- name: id
dtype: int64
splits:
- name: train
num_bytes: 61203076.41321
num_examples: 38527
download_size: 38902807
dataset_size: 61203076.41321
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
dataset_info:
特征:
- 名称: 内容
数据类型: 字符串
- 名称: 元数据
结构体:
- 名称: pile集合名称
序列: 字符串
- 名称: 标识符
数据类型: 64位整数
拆分:
- 名称: 训练集
字节数: 61203076.41321
样本数: 38527
下载大小: 38902807
数据集大小: 61203076.41321
配置:
- 配置名称: 默认
数据文件:
- 拆分: 训练集
路径: data/train-*
提供机构:
timaeus



