PJMixers/fblgit_simple-math-DPO-PreferenceShareGPT

Name: PJMixers/fblgit_simple-math-DPO-PreferenceShareGPT
Creator: PJMixers
Published: 2024-05-30 15:44:40
License: 暂无描述

Hugging Face2024-05-30 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/PJMixers/fblgit_simple-math-DPO-PreferenceShareGPT

下载链接

链接失效反馈

官方服务：

资源简介：

--- tags: - preference - preferences size_categories: - 100K<n<1M task_categories: - reinforcement-learning ---

标签： - 偏好（preference） - 偏好（preferences）数据集规模区间： - 10万<n<100万任务类别： - 强化学习（Reinforcement Learning）

提供机构：

PJMixers

原始信息汇总

数据集概述

5,000+

优质数据集

54 个

任务类型

进入经典数据集