five

distilabel-internal-testing/dpo-mix-4k-criticurus-temperature0.7-v0.0

收藏
Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/dpo-mix-4k-criticurus-temperature0.7-v0.0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过distilabel工具创建的,包含了一个pipeline.yaml文件,用于重现生成数据集的流程。数据集的结构包括多个特征,如instruction(指令)、response(响应)、rating(评分)、dataset_name(数据集名称)、model_name(模型名称)、score(分数)、critique(批评)和raw_output(原始输出)。数据集只有一个默认配置,可以通过Hugging Face的datasets库加载。

该数据集是通过distilabel工具创建的,包含了一个pipeline.yaml文件,用于重现生成数据集的流程。数据集的结构包括多个特征,如instruction(指令)、response(响应)、rating(评分)、dataset_name(数据集名称)、model_name(模型名称)、score(分数)、critique(批评)和raw_output(原始输出)。数据集只有一个默认配置,可以通过Hugging Face的datasets库加载。
提供机构:
distilabel-internal-testing
原始信息汇总

数据集概述

数据集基本信息

  • 名称: dpo-mix-4k-criticurus-temperature0.7-v0.0
  • 大小分类: n<1K
  • 创建工具: distilabel

数据集特征

  • 特征列表:
    • instruction: 数据类型为 string
    • response: 数据类型为 string
    • rating: 数据类型为 float64
    • dataset_name: 数据类型为 string
    • model_name: 数据类型为 string
    • score: 数据类型为 string
    • critique: 数据类型为 string
    • raw_output: 数据类型为 string

数据集结构

  • 分割:
    • train: 包含3996个示例,总字节数为9539790
  • 下载大小: 4772223字节
  • 数据集大小: 9539790字节

配置信息

  • 配置名称: default
  • 数据文件:
    • split: train
    • path: data/train-*

标签

  • 标签:
    • synthetic
    • distilabel
    • rlaif

加载示例

python from datasets import load_dataset

ds = load_dataset("distilabel-internal-testing/dpo-mix-4k-criticurus-temperature0.7-v0.0")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作