PJMixers/jondurbin_py-dpo-v0.1-PreferenceShareGPT
收藏Hugging Face2024-05-31 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/PJMixers/jondurbin_py-dpo-v0.1-PreferenceShareGPT
下载链接
链接失效反馈官方服务:
资源简介:
---
task_categories:
- reinforcement-learning
tags:
- preference
- preferences
size_categories:
- 1K<n<10K
---
提供机构:
PJMixers
原始信息汇总
数据集概述
任务类别
- 强化学习
标签
- 偏好
- 优先级
数据规模
- 1K<n<10K



