five

argilla/oasst_response_comparison

收藏
Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/oasst_response_comparison
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一个符合Argilla数据集格式的配置文件`argilla.cfg`,以及兼容HuggingFace `datasets`库的记录。这些记录可以通过`FeedbackDataset.from_huggingface`方法自动加载,也可以使用`datasets`库通过`load_dataset`独立加载。数据集包含多个字段、问题和响应,可以用于不同的NLP任务。数据集的结构包括字段、问题和指导方针,字段主要是文本字段,问题包括排序问题等。数据集的创建过程和注释过程的信息尚未提供。

该数据集包含一个符合Argilla数据集格式的配置文件`argilla.cfg`,以及兼容HuggingFace `datasets`库的记录。这些记录可以通过`FeedbackDataset.from_huggingface`方法自动加载,也可以使用`datasets`库通过`load_dataset`独立加载。数据集包含多个字段、问题和响应,可以用于不同的NLP任务。数据集的结构包括字段、问题和指导方针,字段主要是文本字段,问题包括排序问题等。数据集的创建过程和注释过程的信息尚未提供。
提供机构:
argilla
原始信息汇总

数据集概述

数据集名称

  • 名称: oasst_response_comparison

数据集大小

  • 大小: 1K<n<10K

数据集标签

  • 标签: rlfh, argilla, human-feedback

数据集描述

  • 配置文件: 包含一个名为argilla.cfg的配置文件,符合Argilla数据集格式。
  • 数据记录: 与HuggingFace datasets兼容的记录格式。
  • 注释指南: 如有定义,可在注释指南部分找到。

数据集加载

  • 使用Argilla加载: 通过pip install argilla --upgrade安装Argilla后,使用以下代码加载数据集: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface("argilla/oasst_response_comparison")

  • 使用datasets加载: 通过pip install datasets --upgrade安装datasets后,使用以下代码加载数据集: python from datasets import load_dataset ds = load_dataset("argilla/oasst_response_comparison")

数据集结构

  • 字段: 支持文本字段,包括prompt, reply_1, reply_2, reply_3,均为TextField类型。
  • 问题: 包括一个reply-ranking问题,类型为RankingQuestion,用于根据偏好对回复进行排序。
  • 注释指南: 提供给注释者的指导,包括如何根据清晰度和帮助性对回复进行排序。

数据集实例

  • 示例: 包含外部ID、字段(如promptreply系列)、元数据和响应(如reply-ranking的排序结果)。

数据集字段

  • 字段: 包括prompt, reply_1, reply_2, reply_3,均为文本字段。
  • 问题: 包括reply-ranking,类型为RankingQuestion,用于排序回复。
  • 可选字段: external_id,用于提供外部ID以链接外部资源。

数据集分割

  • 分割: 单一分割,即train
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作