five

activated-ai/tiny-stories-8k-tokens

收藏
Hugging Face2024-09-17 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/activated-ai/tiny-stories-8k-tokens
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个主要部分:训练集和验证集。训练集包含2119719个例子,验证集包含21990个例子。数据集的特征包括一个名为tokens的int64类型序列。数据集的下载大小为802923887字节,总大小为3780074596字节。数据文件的路径分别为data/train-*和data/validation-*。

The dataset consists of two main parts: a training set and a validation set. The training set contains 2,119,719 examples, and the validation set contains 21,990 examples. The features of the dataset include a sequence of int64 type named tokens. The download size of the dataset is 802,923,887 bytes, and the total size is 3,780,074,596 bytes. The paths for the data files are data/train-* and data/validation-*.
提供机构:
activated-ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作