davide221/reward_model_data
收藏Hugging Face2024-02-05 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/davide221/reward_model_data
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: Instruction
dtype: string
- name: response gemini
dtype: string
- name: score gemini
dtype: string
- name: avg score gemini
dtype: float64
- name: response gpt35
dtype: string
- name: score gpt35
dtype: string
- name: avg score gpt35
dtype: float64
- name: response claude12
dtype: string
- name: score claude12
dtype: string
- name: avg score claude12
dtype: float64
- name: Tags
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 5734430
num_examples: 993
download_size: 2429392
dataset_size: 5734430
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征列表(features):
1. 字段名:指令(Instruction),数据类型:字符串
2. 字段名:Gemini 生成回复(response gemini),数据类型:字符串
3. 字段名:Gemini 评分(score gemini),数据类型:字符串
4. 字段名:Gemini 平均评分(avg score gemini),数据类型:64位浮点数
5. 字段名:GPT-3.5 生成回复(response gpt35),数据类型:字符串
6. 字段名:GPT-3.5 评分(score gpt35),数据类型:字符串
7. 字段名:GPT-3.5 平均评分(avg score gpt35),数据类型:64位浮点数
8. 字段名:Claude 1.2 生成回复(response claude12),数据类型:字符串
9. 字段名:Claude 1.2 评分(score claude12),数据类型:字符串
10. 字段名:Claude 1.2 平均评分(avg score claude12),数据类型:64位浮点数
11. 字段名:标签(Tags),数据类型:字符串
12. 字段名:内置索引字段(__index_level_0__),数据类型:64位整数
数据集划分(splits):
- 划分名称:训练集(train),字节占用量:5734430,样本数量:993
下载总大小:2429392
数据集总存储大小:5734430
配置项(configs):
- 配置名称:默认配置(default),数据文件:
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
davide221
原始信息汇总
数据集概述
特征信息
- Instruction: 类型为字符串。
- response gemini: 类型为字符串。
- score gemini: 类型为字符串。
- avg score gemini: 类型为浮点数。
- response gpt35: 类型为字符串。
- score gpt35: 类型为字符串。
- avg score gpt35: 类型为浮点数。
- response claude12: 类型为字符串。
- score claude12: 类型为字符串。
- avg score claude12: 类型为浮点数。
- Tags: 类型为字符串。
- index_level_0: 类型为整数。
数据分割
- train: 包含993个样本,占用5734430字节。
数据集大小
- 下载大小: 2429392字节。
- 数据集大小: 5734430字节。
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



