five

Source82/osa-alpaca_dataset_augmented_cleaned|自然语言处理数据集|数据增强数据集

收藏
hugging_face2024-06-27 更新2024-06-29 收录
自然语言处理
数据增强
下载链接:
https://hf-mirror.com/datasets/Source82/osa-alpaca_dataset_augmented_cleaned
下载链接
链接失效反馈
资源简介:
该数据集包含三个特征:instruction(指令)、input(输入)和output(输出),均为字符串类型。数据集仅包含一个训练集(train),共有6856个样本,总大小为1958991字节。下载大小为792005字节。默认配置中,数据文件路径为data/train-*。

The dataset contains three features: instruction, input, and output, all of which are of string type. The dataset includes only a training set (train) with 6856 examples, totaling 1958991 bytes in size. The download size is 792005 bytes. In the default configuration, the data file path is data/train-*.
提供机构:
Source82
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • instruction: 类型为 string
    • input: 类型为 string
    • output: 类型为 string
  • 数据分割:

    • train:
      • 字节数: 1958991
      • 样本数: 6856
  • 下载大小: 792005 字节

  • 数据集大小: 1958991 字节

配置

  • 配置名称: default
    • 数据文件:
      • train: 路径为 data/train-*
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集