distilabel-internal-testing/testing-distilabel-cli
收藏Hugging Face2024-03-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/testing-distilabel-cli
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置(push_to_hub和push_to_hub_2),每个配置包含多个特征,如指令(instruction)、完成(completion)、元数据(meta)等。元数据包括ID、来源、类别、子类别、提示、完成、动机应用和输入等信息。数据集主要用于训练模型,可能涉及自然语言处理任务,如指令生成或文本补全。
该数据集包含两个配置(push_to_hub和push_to_hub_2),每个配置包含多个特征,如指令(instruction)、完成(completion)、元数据(meta)等。元数据包括ID、来源、类别、子类别、提示、完成、动机应用和输入等信息。数据集主要用于训练模型,可能涉及自然语言处理任务,如指令生成或文本补全。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
数据集 push_to_hub
- 特征(Features):
instruction:字符串类型completion:字符串类型meta:结构体类型,包含以下字段:id:int64类型source:字符串类型category:字符串类型subcategory:字符串类型prompt:字符串类型completion:字符串类型motivation_app:字符串类型input:字符串类型
model:字符串类型generation:字符串类型
- 分割(Splits):
train:- 数据量:1643736字节
- 样本数:981
- 下载大小:464347字节
- 数据集大小:1643736字节
数据集 push_to_hub_2
- 特征(Features):
instruction:字符串类型completion:字符串类型meta:结构体类型,包含以下字段:id:int64类型source:字符串类型category:字符串类型subcategory:字符串类型prompt:字符串类型completion:字符串类型motivation_app:字符串类型input:字符串类型
model:字符串类型generation:序列字符串类型
- 分割(Splits):
train:- 数据量:773596字节
- 样本数:327
- 下载大小:460946字节
- 数据集大小:773596字节



