five

distilabel-internal-testing/testing-distilabel-cli

收藏
Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/testing-distilabel-cli
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置(push_to_hub和push_to_hub_2),每个配置包含多个特征,如指令(instruction)、完成(completion)、元数据(meta)等。元数据包括ID、来源、类别、子类别、提示、完成、动机应用和输入等信息。数据集主要用于训练模型,可能涉及自然语言处理任务,如指令生成或文本补全。

该数据集包含两个配置(push_to_hub和push_to_hub_2),每个配置包含多个特征,如指令(instruction)、完成(completion)、元数据(meta)等。元数据包括ID、来源、类别、子类别、提示、完成、动机应用和输入等信息。数据集主要用于训练模型,可能涉及自然语言处理任务,如指令生成或文本补全。
提供机构:
distilabel-internal-testing
原始信息汇总

数据集概述

数据集 push_to_hub

  • 特征(Features)
    • instruction:字符串类型
    • completion:字符串类型
    • meta:结构体类型,包含以下字段:
      • id:int64类型
      • source:字符串类型
      • category:字符串类型
      • subcategory:字符串类型
      • prompt:字符串类型
      • completion:字符串类型
      • motivation_app:字符串类型
      • input:字符串类型
    • model:字符串类型
    • generation:字符串类型
  • 分割(Splits)
    • train
      • 数据量:1643736字节
      • 样本数:981
  • 下载大小:464347字节
  • 数据集大小:1643736字节

数据集 push_to_hub_2

  • 特征(Features)
    • instruction:字符串类型
    • completion:字符串类型
    • meta:结构体类型,包含以下字段:
      • id:int64类型
      • source:字符串类型
      • category:字符串类型
      • subcategory:字符串类型
      • prompt:字符串类型
      • completion:字符串类型
      • motivation_app:字符串类型
      • input:字符串类型
    • model:字符串类型
    • generation:序列字符串类型
  • 分割(Splits)
    • train
      • 数据量:773596字节
      • 样本数:327
  • 下载大小:460946字节
  • 数据集大小:773596字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作