five

jayzeng/demo_dpo_raw

收藏
Hugging Face2024-05-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jayzeng/demo_dpo_raw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过distilabel工具生成的,包含了一个pipeline.yaml文件,用于复现生成该数据集的流程。数据集的特征包括instruction、targets、language、language_code、annotation_type、user_id、generation_model、generation、generations、generation_models、model_name、ratings和rationales。数据集只有一个配置,名为default,可以通过Hugging Face的datasets库加载。

该数据集是通过distilabel工具生成的,包含了一个pipeline.yaml文件,用于复现生成该数据集的流程。数据集的特征包括instruction、targets、language、language_code、annotation_type、user_id、generation_model、generation、generations、generation_models、model_name、ratings和rationales。数据集只有一个配置,名为default,可以通过Hugging Face的datasets库加载。
提供机构:
jayzeng
原始信息汇总

数据集概述

数据集基本信息

  • 大小分类: n<1K
  • 下载大小: 2807221字节
  • 数据集大小: 5440984字节

数据集特征

  • instruction: 字符串类型
  • targets: 字符串类型
  • language: 字符串类型
  • language_code: 字符串类型
  • annotation_type: 字符串类型
  • user_id: 字符串类型
  • generation_model: 字符串类型
  • generation: 空值
  • generations: 字符串序列
  • generation_models: 字符串序列
  • model_name: 字符串类型
  • ratings: 空值序列
  • rationales: 空值序列

数据集分割

  • train:
    • num_bytes: 5440984字节
    • num_examples: 3844

配置信息

  • config_name: default
  • data_files:
    • split: train
    • path: data/train-*

标签

  • synthetic
  • distilabel
  • rlaif
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作