mlabonne/alpagasus
收藏Hugging Face2023-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mlabonne/alpagasus
下载链接
链接失效反馈官方服务:
资源简介:
这是一个非官方的AlpaGasus实现数据集,基于原始Alpaca数据集经过GPT-4筛选的版本。数据集包含instruction、input和output三个字段,均为字符串类型。数据集的train划分包含9229个样本,总大小为3918129字节。作者展示了使用这个版本的9k样本训练的模型优于使用原始52k样本训练的模型。
这是一个非官方的AlpaGasus实现数据集,基于原始Alpaca数据集经过GPT-4筛选的版本。数据集包含instruction、input和output三个字段,均为字符串类型。数据集的train划分包含9229个样本,总大小为3918129字节。作者展示了使用这个版本的9k样本训练的模型优于使用原始52k样本训练的模型。
提供机构:
mlabonne
原始信息汇总
数据集概述
数据集特征
- instruction: 数据类型为字符串
- input: 数据类型为字符串
- output: 数据类型为字符串
数据集分割
- train: 包含9229个样本,总大小为3918129字节
数据集大小
- 下载大小: 2486877字节
- 数据集大小: 3918129字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
许可证
- license: gpl-3.0
任务类别
- task_categories: text-generation
标签
- tags:
- alpaca
- llama
大小类别
- size_categories: 1K<n<10K



