hassaan-qaisar/instruction-backtranslation-instruction-dataset-2
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/hassaan-qaisar/instruction-backtranslation-instruction-dataset-2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一个`pipeline.yaml`文件,可用于通过distilabel CLI重现生成数据集的管道。数据集的示例结构包括生成文本、输入(为空)、指令和模型名称。数据集的特征包括输入、指令、生成和模型名称。数据集的分割仅包含训练集,且训练集包含2个样本。数据集是通过distilabel工具创建的,并且可以通过Hugging Face的datasets库加载。
This dataset contains a `pipeline.yaml` which can be used to reproduce the pipeline that generated it in distilabel using the `distilabel` CLI. The examples in the dataset have a structure that includes generation text, input (null), instruction, and model name. The features of the dataset include input, instruction, generation, and model name. The dataset has only a train split, containing 2 examples. The dataset was created with distilabel and can be loaded using the Hugging Face datasets library.
提供机构:
hassaan-qaisar
原始信息汇总
数据集概述
数据集结构
-
特征:
input: 数据类型为nullinstruction: 数据类型为stringgeneration: 数据类型为stringmodel_name: 数据类型为string
-
分割:
train: 包含 2 个样本,占用 3199 字节
-
配置:
default: 包含train分割的数据文件路径为data/train-*
数据集大小
- 下载大小: 14356 字节
- 数据集大小: 3199 字节
标签
syntheticdistilabelrlaif



