Andresckamilo/distilset
收藏Hugging Face2024-06-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Andresckamilo/distilset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具创建的,包含一个pipeline.yaml文件,用于重现生成数据集的管道。数据集的结构包括多个字段,如instruction、completion、meta等,meta字段进一步包含category、completion、id、input、motivation_app、prompt、source和subcategory等子字段。数据集可以通过Hugging Face的datasets库加载。
该数据集是通过distilabel工具创建的,包含一个pipeline.yaml文件,用于重现生成数据集的管道。数据集的结构包括多个字段,如instruction、completion、meta等,meta字段进一步包含category、completion、id、input、motivation_app、prompt、source和subcategory等子字段。数据集可以通过Hugging Face的datasets库加载。
提供机构:
Andresckamilo
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 数据集大小: 小于1KB
数据集内容
- 特征:
instruction: 字符串类型completion: 字符串类型meta: 结构化数据类型,包含以下字段:category: 字符串类型completion: 字符串类型id: int64类型input: null类型motivation_app: null类型prompt: 字符串类型source: 字符串类型subcategory: 字符串类型
model_name: 字符串类型generation: 字符串类型
数据集分割
- 训练集:
- 数据量: 26484字节
- 样本数: 10个
下载信息
- 下载大小: 35254字节
- 数据集大小: 26484字节
配置信息
- 默认配置:
- 数据文件路径:
data/train-*
- 数据文件路径:
标签
- 标签:
- synthetic
- distilabel
- rlaif



