distilabel-internal-testing/ultrafeedback-routing-batch-function
收藏Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/ultrafeedback-routing-batch-function
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具生成的,主要用于展示如何使用distilabel CLI来复现生成该数据集的管道。数据集中包含了一个`pipeline.yaml`文件,用户可以通过该文件来运行或探索生成数据集的配置。数据集的结构包括多个字段,如instruction、generations、generation_models、ratings、rationales和ultrafeedback_model等,这些字段分别表示指令、生成内容、生成模型、评分、理由和使用的模型。数据集的大小为n<1K,包含327个训练样本。
该数据集是通过distilabel工具生成的,主要用于展示如何使用distilabel CLI来复现生成该数据集的管道。数据集中包含了一个`pipeline.yaml`文件,用户可以通过该文件来运行或探索生成数据集的配置。数据集的结构包括多个字段,如instruction、generations、generation_models、ratings、rationales和ultrafeedback_model等,这些字段分别表示指令、生成内容、生成模型、评分、理由和使用的模型。数据集的大小为n<1K,包含327个训练样本。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
数据集基本信息
- 数据集名称: ultrafeedback-routing-batch-function
- 数据集大小:
- 下载大小: 971463字节
- 数据集大小: 1945301字节
- 示例数量: 327个(仅训练集)
- 数据集类别: 小于1K字节
数据集特征
- instruction: 字符串类型
- generations: 字符串序列类型
- generation_models: 字符串序列类型
- ratings: 整数序列类型(int64)
- rationales: 字符串序列类型
- ultrafeedback_model: 字符串类型
数据集结构
- 配置: 默认
- 示例结构:
- generation_models: 包含多个模型名称的字符串序列
- generations: 包含多个生成文本的字符串序列
- instruction: 问题描述字符串
- ratings: 包含多个评分值的整数序列
- rationales: 包含多个推理理由的字符串序列
- ultrafeedback_model: 模型名称字符串
数据集加载
- 加载方式: python from datasets import load_dataset ds = load_dataset("distilabel-internal-testing/ultrafeedback-routing-batch-function")



