five

distilabel-internal-testing/ultrafeedback-routing-batch-function

收藏
Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/ultrafeedback-routing-batch-function
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过distilabel工具生成的,主要用于展示如何使用distilabel CLI来复现生成该数据集的管道。数据集中包含了一个`pipeline.yaml`文件,用户可以通过该文件来运行或探索生成数据集的配置。数据集的结构包括多个字段,如instruction、generations、generation_models、ratings、rationales和ultrafeedback_model等,这些字段分别表示指令、生成内容、生成模型、评分、理由和使用的模型。数据集的大小为n<1K,包含327个训练样本。

该数据集是通过distilabel工具生成的,主要用于展示如何使用distilabel CLI来复现生成该数据集的管道。数据集中包含了一个`pipeline.yaml`文件,用户可以通过该文件来运行或探索生成数据集的配置。数据集的结构包括多个字段,如instruction、generations、generation_models、ratings、rationales和ultrafeedback_model等,这些字段分别表示指令、生成内容、生成模型、评分、理由和使用的模型。数据集的大小为n<1K,包含327个训练样本。
提供机构:
distilabel-internal-testing
原始信息汇总

数据集概述

数据集基本信息

  • 数据集名称: ultrafeedback-routing-batch-function
  • 数据集大小:
    • 下载大小: 971463字节
    • 数据集大小: 1945301字节
  • 示例数量: 327个(仅训练集)
  • 数据集类别: 小于1K字节

数据集特征

  • instruction: 字符串类型
  • generations: 字符串序列类型
  • generation_models: 字符串序列类型
  • ratings: 整数序列类型(int64)
  • rationales: 字符串序列类型
  • ultrafeedback_model: 字符串类型

数据集结构

  • 配置: 默认
  • 示例结构:
    • generation_models: 包含多个模型名称的字符串序列
    • generations: 包含多个生成文本的字符串序列
    • instruction: 问题描述字符串
    • ratings: 包含多个评分值的整数序列
    • rationales: 包含多个推理理由的字符串序列
    • ultrafeedback_model: 模型名称字符串

数据集加载

  • 加载方式: python from datasets import load_dataset ds = load_dataset("distilabel-internal-testing/ultrafeedback-routing-batch-function")
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作