distilabel-internal-testing/reward-bench-critique-alpacaeval-easy

Name: distilabel-internal-testing/reward-bench-critique-alpacaeval-easy
Creator: distilabel-internal-testing
Published: 2024-04-04 14:44:42
License: 暂无描述

Hugging Face2024-04-04 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/distilabel-internal-testing/reward-bench-critique-alpacaeval-easy

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是`allenai/reward-bench`数据集的一个小规模子集，用于测试批判模型。它通过筛选出`alpacaeval-easy`子集的数据，并为每个提示生成两个响应（一个被选中，一个被拒绝），然后记录相关信息。数据集包含提示、响应、模型、子集、ID和是否被选中等特征。

提供机构：

distilabel-internal-testing

原始信息汇总

数据集概述

数据集特征

prompt：字符串类型
response：字符串类型
model：字符串类型
subset：字符串类型
id：整数类型（int64）
is_chosen：布尔类型

数据集划分

train：
- 数据量：302896字节
- 示例数量：200

数据集大小

下载大小：168802字节
数据集总大小：302896字节

配置

default：
- 数据文件：
  - 划分：train
  - 路径：data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集