MikeMpapa/bedrock_dataset_v0_and_v1
收藏Hugging Face2024-06-20 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MikeMpapa/bedrock_dataset_v0_and_v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:prompt、completion和text,均为字符串类型。数据集分为训练集和验证集,训练集包含9000个样本,验证集包含1000个样本。数据集的下载大小为22604558字节,总大小为68906850字节。配置信息指定了数据文件的路径,训练集数据文件路径为data/train-*,验证集数据文件路径为data/validation-*。
The dataset includes three main features: prompt, completion, and text, all of which are of string type. The dataset is divided into a training set and a validation set, with the training set containing 9000 samples and the validation set containing 1000 samples. The download size of the dataset is 22604558 bytes, and the total size is 68906850 bytes. The configuration information specifies the paths of the data files, with the training set data file path being data/train-* and the validation set data file path being data/validation-*.
提供机构:
MikeMpapa
原始信息汇总
数据集概述
数据集特征
- prompt: 数据类型为字符串。
- completion: 数据类型为字符串。
- text: 数据类型为字符串。
数据集划分
- train: 包含9000个样本,占用61891404字节。
- validation: 包含1000个样本,占用7015446字节。
数据集大小
- 下载大小: 22604558字节。
- 数据集总大小: 68906850字节。
配置
- config_name: default
- data_files:
- train: 路径为
data/train-*。 - validation: 路径为
data/validation-*。
- train: 路径为
- data_files:



