luca0621/multi-RLHF-processed-llama1B-dataset-with-10000-rewards-seperate

Name: luca0621/multi-RLHF-processed-llama1B-dataset-with-10000-rewards-seperate
Creator: luca0621
Published: 2024-11-30 22:10:10
License: 暂无描述

Hugging Face2024-11-30 更新2024-12-14 收录

下载链接：

https://hf-mirror.com/datasets/luca0621/multi-RLHF-processed-llama1B-dataset-with-10000-rewards-seperate

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含查询、响应和奖励三个特征，数据类型分别为字符串和浮点数。数据集分为训练集和测试集，训练集包含80000个样本，测试集包含20000个样本。数据文件路径配置为训练集路径为data/train-*，测试集路径为data/test-*。

The dataset includes three features: query, response, and reward, with data types of string and float64. The dataset is divided into a training set and a test set, with the training set containing 80,000 samples and the test set containing 20,000 samples. The data file paths are configured as data/train-* for the training set and data/test-* for the test set.

提供机构：

luca0621

5,000+

优质数据集

54 个

任务类型

进入经典数据集