victorialee/openai_summarize_comparisons_relabel_GPTJ
收藏Hugging Face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/victorialee/openai_summarize_comparisons_relabel_GPTJ
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
splits:
- name: test
num_bytes: 143018505
num_examples: 83629
relabeled_number: 27440
relabeled_percentage: 0.32811584498200386
- name: train
num_bytes: 157425966
num_examples: 92534
relabeled_number: 18447
relabeled_percentage: 0.19935375105366676
- name: valid1
num_bytes: 56686271
num_examples: 33082
- name: valid2
num_bytes: 86396487
num_examples: 50715
download_size: 20257716
dataset_size: 443527229
---
提供机构:
victorialee
原始信息汇总
数据集概述
特征信息
- prompt: 数据类型为字符串。
- chosen: 数据类型为字符串。
- rejected: 数据类型为字符串。
数据分割
- test:
- 字节数: 143018505
- 样本数: 83629
- 重新标注样本数: 27440
- 重新标注比例: 0.32811584498200386
- train:
- 字节数: 157425966
- 样本数: 92534
- 重新标注样本数: 18447
- 重新标注比例: 0.19935375105366676
- valid1:
- 字节数: 56686271
- 样本数: 33082
- valid2:
- 字节数: 86396487
- 样本数: 50715
数据集大小
- 下载大小: 20257716 字节
- 数据集大小: 443527229 字节



