Source82/osa-alpaca_dataset_augmented_cleaned|自然语言处理数据集|数据增强数据集
收藏hugging_face2024-06-27 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Source82/osa-alpaca_dataset_augmented_cleaned
下载链接
链接失效反馈资源简介:
该数据集包含三个特征:instruction(指令)、input(输入)和output(输出),均为字符串类型。数据集仅包含一个训练集(train),共有6856个样本,总大小为1958991字节。下载大小为792005字节。默认配置中,数据文件路径为data/train-*。
The dataset contains three features: instruction, input, and output, all of which are of string type. The dataset includes only a training set (train) with 6856 examples, totaling 1958991 bytes in size. The download size is 792005 bytes. In the default configuration, the data file path is data/train-*.
提供机构:
Source82
原始信息汇总
数据集概述
数据集信息
-
特征:
instruction: 类型为stringinput: 类型为stringoutput: 类型为string
-
数据分割:
train:- 字节数: 1958991
- 样本数: 6856
-
下载大小: 792005 字节
-
数据集大小: 1958991 字节
配置
- 配置名称:
default- 数据文件:
train: 路径为data/train-*
- 数据文件:
