distilabel-internal-testing/dpo-mix-4k-criticurus-temperature0.7-v0.0
收藏Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/dpo-mix-4k-criticurus-temperature0.7-v0.0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具创建的,包含了一个pipeline.yaml文件,用于重现生成数据集的流程。数据集的结构包括多个特征,如instruction(指令)、response(响应)、rating(评分)、dataset_name(数据集名称)、model_name(模型名称)、score(分数)、critique(批评)和raw_output(原始输出)。数据集只有一个默认配置,可以通过Hugging Face的datasets库加载。
该数据集是通过distilabel工具创建的,包含了一个pipeline.yaml文件,用于重现生成数据集的流程。数据集的结构包括多个特征,如instruction(指令)、response(响应)、rating(评分)、dataset_name(数据集名称)、model_name(模型名称)、score(分数)、critique(批评)和raw_output(原始输出)。数据集只有一个默认配置,可以通过Hugging Face的datasets库加载。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
数据集基本信息
- 名称: dpo-mix-4k-criticurus-temperature0.7-v0.0
- 大小分类: n<1K
- 创建工具: distilabel
数据集特征
- 特征列表:
instruction: 数据类型为stringresponse: 数据类型为stringrating: 数据类型为float64dataset_name: 数据类型为stringmodel_name: 数据类型为stringscore: 数据类型为stringcritique: 数据类型为stringraw_output: 数据类型为string
数据集结构
- 分割:
train: 包含3996个示例,总字节数为9539790
- 下载大小: 4772223字节
- 数据集大小: 9539790字节
配置信息
- 配置名称: default
- 数据文件:
split: trainpath: data/train-*
标签
- 标签:
- synthetic
- distilabel
- rlaif
加载示例
python from datasets import load_dataset
ds = load_dataset("distilabel-internal-testing/dpo-mix-4k-criticurus-temperature0.7-v0.0")



