jayzeng/demo_dpo_raw
收藏Hugging Face2024-05-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jayzeng/demo_dpo_raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具生成的,包含了一个pipeline.yaml文件,用于复现生成该数据集的流程。数据集的特征包括instruction、targets、language、language_code、annotation_type、user_id、generation_model、generation、generations、generation_models、model_name、ratings和rationales。数据集只有一个配置,名为default,可以通过Hugging Face的datasets库加载。
该数据集是通过distilabel工具生成的,包含了一个pipeline.yaml文件,用于复现生成该数据集的流程。数据集的特征包括instruction、targets、language、language_code、annotation_type、user_id、generation_model、generation、generations、generation_models、model_name、ratings和rationales。数据集只有一个配置,名为default,可以通过Hugging Face的datasets库加载。
提供机构:
jayzeng
原始信息汇总
数据集概述
数据集基本信息
- 大小分类: n<1K
- 下载大小: 2807221字节
- 数据集大小: 5440984字节
数据集特征
- instruction: 字符串类型
- targets: 字符串类型
- language: 字符串类型
- language_code: 字符串类型
- annotation_type: 字符串类型
- user_id: 字符串类型
- generation_model: 字符串类型
- generation: 空值
- generations: 字符串序列
- generation_models: 字符串序列
- model_name: 字符串类型
- ratings: 空值序列
- rationales: 空值序列
数据集分割
- train:
- num_bytes: 5440984字节
- num_examples: 3844
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*
标签
- synthetic
- distilabel
- rlaif



