aimlresearch2023/distilabel_13
收藏Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/aimlresearch2023/distilabel_13
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:keep_columns和push_to_argilla。每个配置都有不同的特征和结构,主要包括指令、生成内容、生成模型、评分和理由等。数据集是通过distilabel工具生成的,并且可以通过提供的pipeline.yaml文件进行复现。
该数据集包含两个配置:keep_columns和push_to_argilla。每个配置都有不同的特征和结构,主要包括指令、生成内容、生成模型、评分和理由等。数据集是通过distilabel工具生成的,并且可以通过提供的pipeline.yaml文件进行复现。
提供机构:
aimlresearch2023
原始信息汇总
数据集概述
数据集基本信息
- 大小分类: n<1K
- 标签: synthetic, distilabel, rlaif
配置: keep_columns
- 特征:
- instruction: 字符串
- generations: 字符串序列
- generation_models: 字符串序列
- ratings: 整数序列
- rationales: 字符串序列
- 分割:
- train: 3个样本,8983字节
- 下载大小: 32178字节
- 数据集大小: 8983字节
配置: push_to_argilla
- 特征:
- instruction: 字符串
- quality:
- status: 字符串
- user_id: 字符串
- value: 字符串
- metadata: 字符串
- avg_rating: 浮点数
- num_responses: 整数
- agreement_ratio: 浮点数
- raw_responses: 整数序列
- kind: 字符串
- cluster_description: 字符串
- topic: 字符串
- generation_models: 字符串序列
- generations: 字符串序列
- model_name: 字符串
- ratings: 整数序列
- rationales: 字符串序列
- 分割:
- train: 3个样本,11296字节
- 下载大小: 44690字节
- 数据集大小: 11296字节
数据文件
- 配置: keep_columns
- train: keep_columns/train-*
- 配置: push_to_argilla
- train: push_to_argilla/train-*



