dustinwloring1988/pretrain-fineweb-small-sample
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/dustinwloring1988/pretrain-fineweb-small-sample
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要特征:text(文本)和score(分数)。数据集仅包含一个训练分割(train),共有604,506个样本。该数据集仅用于测试新的训练脚本,不应在生产环境中使用。
The dataset contains two main features: text and score. It includes only one training split (train) with 604,506 examples. This dataset is intended solely for testing new training scripts and should not be used in production.
提供机构:
dustinwloring1988
原始信息汇总
数据集概述
语言
- 英文(en)
数据集信息
特征
- text: 类型为字符串(string)
- score: 类型为浮点数(float64)
数据分割
- train:
- 字节数: 2881195429.9504414
- 样本数: 604506
数据大小
- 下载大小: 1716615285
- 数据集大小: 2881195429.9504414
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



