Andresckamilo/Ultrafeedback

Name: Andresckamilo/Ultrafeedback
Creator: Andresckamilo
Published: 2024-06-03 10:37:01
License: 暂无描述

Hugging Face2024-06-03 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/Andresckamilo/Ultrafeedback

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Ultrafeedback，是通过distilabel工具生成的。数据集包含一个`pipeline.yaml`文件，用于在distilabel中重现生成该数据集的流程。数据集的结构包括多个字段，如`instruction`、`generations`、`generation_models`、`ratings`、`rationales`和`ultrafeedback_model`。数据集的分割为`train`，包含327个样本，总大小为1334601字节。数据集的标签包括`synthetic`、`distilabel`和`rlaif`。

提供机构：

Andresckamilo

原始信息汇总

数据集概述

数据集基本信息

大小分类: 小于1K
下载大小: 663913字节
数据集大小: 1334601字节
训练集大小: 327个样本，占用1334601字节

数据集特征

instruction: 字符串类型
generations: 字符串序列
generation_models: 字符串序列
ratings: 整数序列（int64类型）
rationales: 字符串序列
ultrafeedback_model: 字符串类型

数据集配置

配置名称: default
数据文件:
- split: train
- 路径: data/train-*

数据集加载示例

python from datasets import load_dataset

ds = load_dataset("Andresckamilo/Ultrafeedback")

数据集示例结构

配置: default
示例内容:
- generation_models: 包含多个模型名称的列表
- generations: 包含多个生成文本的列表
- instruction: 指令文本
- ratings: 包含多个评分的列表
- rationales: 包含多个理由的列表
- ultrafeedback_model: 模型名称

5,000+

优质数据集

54 个

任务类型

进入经典数据集