Writer/TinyStoriesInstruct-v0-32k-0.2
收藏Hugging Face2024-07-13 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Writer/TinyStoriesInstruct-v0-32k-0.2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括id、source、tokens和messages。其中,messages是一个列表,包含content、id、role和tokens等子特征。数据集分为训练集和测试集,训练集包含15,524个样本,测试集包含157个样本。数据集的下载大小为1,205,826,510字节,总大小为2,703,772,137字节。
The dataset contains multiple features, including id, source, tokens, and messages. The messages feature is a list containing sub-features such as content, id, role, and tokens. The dataset is divided into a training set and a test set, with the training set containing 15,524 samples and the test set containing 157 samples. The download size of the dataset is 1,205,826,510 bytes, and the total size is 2,703,772,137 bytes.
提供机构:
Writer
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- source: 字符串类型
- tokens: 64位整数类型
- messages: 列表类型,包含以下子特征:
- content: 字符串类型
- id: 字符串类型
- role: 字符串类型
- tokens: 64位整数类型
数据分割
- train:
- 字节数: 2676706404
- 样本数: 15524
- test:
- 字节数: 27065733
- 样本数: 157
数据集大小
- 下载大小: 1205826510 字节
- 数据集总大小: 2703772137 字节
配置
- config_name: default
- data_files:
- train: data/train-*
- test: data/test-*
- data_files:



