reciprocate/ultrafeedback_cleaned_high_dpo

Name: reciprocate/ultrafeedback_cleaned_high_dpo
Creator: reciprocate
Published: 2024-01-11 15:43:42
License: 暂无描述

Hugging Face2024-01-11 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/reciprocate/ultrafeedback_cleaned_high_dpo

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个主要特征：prompt（提示）、chosen（选择的回答）和rejected（拒绝的回答）。其中，chosen和rejected都是列表类型，包含content（内容）和role（角色）两个子特征。数据集分为train（训练）和test（测试）两个部分，分别包含38037和1964个样本。数据集的下载大小为94746323字节，总大小为174932899.14188957字节。

提供机构：

reciprocate

原始信息汇总

数据集概述

特征信息

prompt: 数据类型为字符串。
chosen: 包含以下子特征：
- content: 数据类型为字符串。
- role: 数据类型为字符串。
rejected: 包含以下子特征：
- content: 数据类型为字符串。
- role: 数据类型为字符串。

数据分割

train: 包含38037个样本，总字节数为166376139.14188957。
test: 包含1964个样本，总字节数为8556760。

数据集大小

下载大小: 94746323字节。
数据集大小: 174932899.14188957字节。

配置信息

default: 包含以下数据文件：
- train: 路径为data/train-*。
- test: 路径为data/test-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集