distilabel-internal-testing/reward-bench-critique-alpacaeval-easy
收藏Hugging Face2024-04-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/reward-bench-critique-alpacaeval-easy
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是`allenai/reward-bench`数据集的一个小规模子集,用于测试批判模型。它通过筛选出`alpacaeval-easy`子集的数据,并为每个提示生成两个响应(一个被选中,一个被拒绝),然后记录相关信息。数据集包含提示、响应、模型、子集、ID和是否被选中等特征。
该数据集是`allenai/reward-bench`数据集的一个小规模子集,用于测试批判模型。它通过筛选出`alpacaeval-easy`子集的数据,并为每个提示生成两个响应(一个被选中,一个被拒绝),然后记录相关信息。数据集包含提示、响应、模型、子集、ID和是否被选中等特征。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
数据集特征
- prompt:字符串类型
- response:字符串类型
- model:字符串类型
- subset:字符串类型
- id:整数类型(int64)
- is_chosen:布尔类型
数据集划分
- train:
- 数据量:302896字节
- 示例数量:200
数据集大小
- 下载大小:168802字节
- 数据集总大小:302896字节
配置
- default:
- 数据文件:
- 划分:train
- 路径:data/train-*
- 数据文件:



