mnoukhov/openai_summarize_generated_20k_relabel_pythia410m-dpo1_margin
收藏Hugging Face2024-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mnoukhov/openai_summarize_generated_20k_relabel_pythia410m-dpo1_margin
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
- name: pred_chosen
dtype: float32
- name: pred_rejected
dtype: float32
splits:
- name: train
num_bytes: 36142323
num_examples: 20000
download_size: 22126174
dataset_size: 36142323
description: test
source_datasets:
- mnoukhov/openai_summarize_comparisons_tldrprompt
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
pretty_name: openai summarize test
---
数据集信息:
特征:
- 名称:提示词(prompt),数据类型:字符串(string)
- 名称:优选响应(chosen),数据类型:字符串(string)
- 名称:落选响应(rejected),数据类型:字符串(string)
- 名称:优选响应预测得分(pred_chosen),数据类型:单精度浮点数(float32)
- 名称:落选响应预测得分(pred_rejected),数据类型:单精度浮点数(float32)
数据集划分:
- 名称:训练集(train),占用字节数:36142323,样本数量:20000
下载大小:22126174
数据集总大小:36142323
数据集描述:测试
源数据集:
- mnoukhov/openai_summarize_comparisons_tldrprompt
配置项:
- 配置名称:默认(default),数据文件:
- 拆分:训练集,路径:data/train-*
展示名称:OpenAI 摘要测试
提供机构:
mnoukhov
原始信息汇总
数据集概述
数据集信息
特征
- prompt: 数据类型为字符串。
- chosen: 数据类型为字符串。
- rejected: 数据类型为字符串。
- pred_chosen: 数据类型为浮点数(float32)。
- pred_rejected: 数据类型为浮点数(float32)。
数据分割
- train: 包含20000个样本,占用36142323字节。
数据集大小
- 下载大小: 22126174字节。
- 实际大小: 36142323字节。
描述
- 描述: test
来源数据集
- mnoukhov/openai_summarize_comparisons_tldrprompt
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
显示名称
- pretty_name: openai summarize test



