distilabel-internal-testing/Capybara-Preferences-Remaining
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/Capybara-Preferences-Remaining
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Capybara-Preferences-Remaining,使用distilabel工具生成。数据集包含一个pipeline.yaml文件,可用于在distilabel中重现生成该数据集的管道。数据集的结构包括多个特征,如source、messages、generations、generation_models、ratings、rationales和ultrafeedback_model。数据集的大小小于1K,包含7841个训练样本。
该数据集名为Capybara-Preferences-Remaining,使用distilabel工具生成。数据集包含一个pipeline.yaml文件,可用于在distilabel中重现生成该数据集的管道。数据集的结构包括多个特征,如source、messages、generations、generation_models、ratings、rationales和ultrafeedback_model。数据集的大小小于1K,包含7841个训练样本。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
基本信息
- 数据集名称: Capybara-Preferences-Remaining
- 大小分类: n<1K
- 下载大小: 48015041字节
- 数据集大小: 95782797.48751344字节
- 训练集大小:
- 字节数: 95782797.48751344
- 示例数: 7841
数据集结构
- 特征:
- source: 字符串类型
- messages: 列表类型,包含:
- content: 字符串类型
- role: 字符串类型
- generations: 序列类型,字符串
- generation_models: 序列类型,字符串
- ratings: 序列类型,整数64位
- rationales: 序列类型,字符串
- ultrafeedback_model: 字符串类型
配置信息
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
标签
- 标签:
- synthetic
- distilabel
- rlaif



