therem/dpo_dataset
收藏Hugging Face2023-12-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/therem/dpo_dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: default
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
splits:
- name: train
num_bytes: 4278828
num_examples: 2889
- name: test
num_bytes: 1074941
num_examples: 723
download_size: 1477190
dataset_size: 5353769
- config_name: main
features:
- name: prompt
dtype: string
- name: chosen
dtype: string
- name: rejected
dtype: string
splits:
- name: train
num_bytes: 4278828
num_examples: 2889
- name: test
num_bytes: 1074941
num_examples: 723
download_size: 1477190
dataset_size: 5353769
- config_name: prompt_eval
features:
- name: prompt
dtype: string
splits:
- name: train
num_bytes: 6342
num_examples: 49
download_size: 8032
dataset_size: 6342
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- config_name: main
data_files:
- split: train
path: main/train-*
- split: test
path: main/test-*
- config_name: prompt_eval
data_files:
- split: train
path: prompt_eval/train-*
---
提供机构:
therem
原始信息汇总
数据集概述
配置信息
默认配置 (default)
- 特征:
prompt: 字符串类型chosen: 字符串类型rejected: 字符串类型
- 分割:
train: 4,278,828 字节, 2,889 个样本test: 1,074,941 字节, 723 个样本
- 下载大小: 1,477,190 字节
- 数据集大小: 5,353,769 字节
主要配置 (main)
- 特征:
prompt: 字符串类型chosen: 字符串类型rejected: 字符串类型
- 分割:
train: 4,278,828 字节, 2,889 个样本test: 1,074,941 字节, 723 个样本
- 下载大小: 1,477,190 字节
- 数据集大小: 5,353,769 字节
提示评估配置 (prompt_eval)
- 特征:
prompt: 字符串类型
- 分割:
train: 6,342 字节, 49 个样本
- 下载大小: 8,032 字节
- 数据集大小: 6,342 字节
数据文件路径
-
默认配置 (
default):train:data/train-*test:data/test-*
-
主要配置 (
main):train:main/train-*test:main/test-*
-
提示评估配置 (
prompt_eval):train:prompt_eval/train-*



