PJMixers/fblgit_simple-math-DPO-PreferenceShareGPT
收藏Hugging Face2024-05-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/PJMixers/fblgit_simple-math-DPO-PreferenceShareGPT
下载链接
链接失效反馈官方服务:
资源简介:
---
tags:
- preference
- preferences
size_categories:
- 100K<n<1M
task_categories:
- reinforcement-learning
---
标签:
- 偏好(preference)
- 偏好(preferences)
数据集规模区间:
- 10万<n<100万
任务类别:
- 强化学习(Reinforcement Learning)
提供机构:
PJMixers
原始信息汇总
数据集概述
标签
- 偏好
- 偏好
大小分类
- 100K<n<1M
任务分类
- 强化学习



