five

argilla/oasst_response_quality

收藏
Hugging Face2023-08-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/oasst_response_quality
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的数据记录。数据集主要用于评估聊天助手的回答质量,包含提示(prompt)和回答(response)两个主要字段,并通过多个问题(如相关性、内容分类、评分等)来评估回答的质量。数据集可以通过Argilla或HuggingFace的`datasets`库加载。

该数据集包含一个符合Argilla数据集格式的配置文件`argilla.yaml`,以及兼容HuggingFace `datasets`库的数据记录。数据集主要用于评估聊天助手的回答质量,包含提示(prompt)和回答(response)两个主要字段,并通过多个问题(如相关性、内容分类、评分等)来评估回答的质量。数据集可以通过Argilla或HuggingFace的`datasets`库加载。
提供机构:
argilla
原始信息汇总

数据集概述

数据集名称

  • 名称: oasst_response_quality

数据集大小

  • 大小: 1K<n<10K

数据集标签

  • 标签: rlfh, argilla, human-feedback

数据集加载方式

  • 使用Argilla加载: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface("argilla/oasst_response_quality")

  • 使用datasets库加载: python from datasets import load_dataset ds = load_dataset("argilla/oasst_response_quality")

数据集结构

  • 数据字段:

    • prompt: 类型为TextField,必填。
    • response: 类型为TextField,必填。
  • 数据问题:

    • relevant: 类型为LabelQuestion,必填,允许值为[Yes, No]。
    • content_class: 类型为MultiLabelQuestion,必填,允许值为[hate, sexual, violent, pii, untruthful, not_english, inappropriate]。
    • rating: 类型为RatingQuestion,必填,允许值为[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]。
    • corrected-text: 类型为TextQuestion,必填。
  • 数据建议:

    • relevant-suggestion: 类型为label_selection,允许值为[Yes, No]。
    • content_class-suggestion: 类型为multi_label_selection,允许值为[hate, sexual, violent, pii, untruthful, not_english, inappropriate]。
    • rating-suggestion: 类型为rating,允许值为[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]。
    • corrected-text-suggestion: 类型为text
  • 外部ID: 可选字段,用于提供数据集记录的外部ID。

数据集语言

  • 语言: [更多信息需要补充]

数据集分割

  • 分割: 仅包含train分割。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作