argilla/oasst_response_comparison

Name: argilla/oasst_response_comparison
Creator: argilla
Published: 2023-11-29 11:23:51
License: 暂无描述

Hugging Face2023-11-29 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/argilla/oasst_response_comparison

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含一个符合Argilla数据集格式的配置文件`argilla.cfg`，以及兼容HuggingFace `datasets`库的记录。这些记录可以通过`FeedbackDataset.from_huggingface`方法自动加载，也可以使用`datasets`库通过`load_dataset`独立加载。数据集包含多个字段、问题和响应，可以用于不同的NLP任务。数据集的结构包括字段、问题和指导方针，字段主要是文本字段，问题包括排序问题等。数据集的创建过程和注释过程的信息尚未提供。

提供机构：

argilla

原始信息汇总

数据集概述

数据集名称

名称: oasst_response_comparison

数据集大小

大小: 1K<n<10K

数据集标签

标签: rlfh, argilla, human-feedback

数据集描述

配置文件: 包含一个名为argilla.cfg的配置文件，符合Argilla数据集格式。
数据记录: 与HuggingFace datasets兼容的记录格式。
注释指南: 如有定义，可在注释指南部分找到。

数据集加载

使用Argilla加载: 通过pip install argilla --upgrade安装Argilla后，使用以下代码加载数据集： python import argilla as rg ds = rg.FeedbackDataset.from_huggingface("argilla/oasst_response_comparison")
使用datasets加载: 通过pip install datasets --upgrade安装datasets后，使用以下代码加载数据集： python from datasets import load_dataset ds = load_dataset("argilla/oasst_response_comparison")

数据集结构

字段: 支持文本字段，包括prompt, reply_1, reply_2, reply_3，均为TextField类型。
问题: 包括一个reply-ranking问题，类型为RankingQuestion，用于根据偏好对回复进行排序。
注释指南: 提供给注释者的指导，包括如何根据清晰度和帮助性对回复进行排序。

数据集实例

示例: 包含外部ID、字段（如prompt和reply系列）、元数据和响应（如reply-ranking的排序结果）。

数据集字段

字段: 包括prompt, reply_1, reply_2, reply_3，均为文本字段。
问题: 包括reply-ranking，类型为RankingQuestion，用于排序回复。
可选字段: external_id，用于提供外部ID以链接外部资源。

数据集分割

分割: 单一分割，即train。

5,000+

优质数据集

54 个

任务类型

进入经典数据集