MikeMpapa/instruction_dataset_mmm_CharReduced
收藏Hugging Face2024-06-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MikeMpapa/instruction_dataset_mmm_CharReduced
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含40000个训练样本,每个样本具有四个特征:system、instruction、input和output,均为字符串类型。数据集的总大小为215370080字节,下载大小为64391967字节。数据文件位于data/train-*路径下。
The dataset contains 40,000 training samples, each with four features: system, instruction, input, and output, all of which are of string type. The total size of the dataset is 215,370,080 bytes, with a download size of 64,391,967 bytes. The data files are located under the path data/train-*.
提供机构:
MikeMpapa
原始信息汇总
数据集概述
数据集特征
- system:数据类型为字符串。
- instruction:数据类型为字符串。
- input:数据类型为字符串。
- output:数据类型为字符串。
数据集划分
- train:包含140000个示例,总大小为1955530953字节。
数据集大小
- 下载大小:494987061字节。
- 数据集总大小:1955530953字节。
配置信息
- 配置名称:default
- 数据文件路径:
- split:train
- path:data/train-*



