distilabel-internal-testing/airoboros-3.2-writing-ultrafeedback
收藏Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/airoboros-3.2-writing-ultrafeedback
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:generate_with_anthropic和keep_columns。generate_with_anthropic配置用于生成对话内容,包含用户和助手的对话记录,以及生成的内容和模型名称。keep_columns配置则包含指令、生成内容、模型名称、评分和理由等信息,用于评估AI助手在对话中的指令遵循能力和生成内容的质量。数据集的主要目的是通过生成对话内容来评估AI助手的表现。
该数据集包含两个配置:generate_with_anthropic和keep_columns。generate_with_anthropic配置用于生成对话内容,包含用户和助手的对话记录,以及生成的内容和模型名称。keep_columns配置则包含指令、生成内容、模型名称、评分和理由等信息,用于评估AI助手在对话中的指令遵循能力和生成内容的质量。数据集的主要目的是通过生成对话内容来评估AI助手的表现。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
基本信息
- 数据集大小: 小于1K条记录
- 标签: 合成数据、distilabel、rlaif
配置详情
-
generate_with_anthropic
- 特征:
- id: 字符串类型
- messages: 列表类型,包含
- content: 字符串类型
- role: 字符串类型
- instruction: 字符串类型
- model_name: 字符串类型
- generation: 字符串类型
- 数据分割:
- train: 100个示例,占用1400046字节
- 下载大小: 797413字节
- 数据集大小: 1400046字节
- 特征:
-
keep_columns
- 特征:
- instruction: 字符串类型
- generations: 字符串序列类型
- generation_models: 字符串序列类型
- ratings: 整数序列类型
- rationales: 字符串序列类型
- ultrafeedback_model: 字符串类型
- 数据分割:
- train: 100个示例,占用1163939字节
- 下载大小: 642391字节
- 数据集大小: 1163939字节
- 特征:
数据文件
- generate_with_anthropic:
- 数据文件路径: generate_with_anthropic/train-*
- keep_columns:
- 数据文件路径: keep_columns/train-*



