aimlresearch2023/distilabel_12
收藏Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/aimlresearch2023/distilabel_12
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具创建的,包含一个`pipeline.yaml`文件,用于重现生成数据集的流程。数据集的结构包括指令、生成内容、生成模型、评分和理由等字段。数据集的配置为默认配置,可以通过Hugging Face的`load_dataset`方法加载。
该数据集是通过distilabel工具创建的,包含一个`pipeline.yaml`文件,用于重现生成数据集的流程。数据集的结构包括指令、生成内容、生成模型、评分和理由等字段。数据集的配置为默认配置,可以通过Hugging Face的`load_dataset`方法加载。
提供机构:
aimlresearch2023
原始信息汇总
数据集概述
数据集基本信息
- 名称: distilabel_12
- 大小: 小于1K条记录
- 创建工具: distilabel
数据集特征
- instruction: 字符串类型,提供如何制作安全有效的自制多功能清洁剂的详细步骤说明。
- generations: 字符串序列,包含具体的清洁剂制作步骤和使用说明。
- generation_models: 字符串序列,列出用于生成内容的模型。
- ratings: 整数序列,表示对生成内容的评价。
- rationales: 字符串序列,提供对生成内容的评价理由。
数据集分割
- 训练集: 包含3个示例,总大小为16791字节。
数据集配置
- 默认配置: 数据文件路径为
data/train-*。
数据集标签
- 标签: 合成数据、distilabel、rlaif
数据集加载示例
python from datasets import load_dataset
ds = load_dataset("aimlresearch2023/distilabel_12")



