five

CarperAI Human Preference Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://huggingface.co/datasets/CarperAI/openai_summarize_comparisons
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由CarperAI提供,包含了针对各种任务的人类偏好。该数据集被用于COFS-DPO方法中的强化学习人类反馈(RLHF)。其任务领域为跨领域学习。

This dataset is provided by CarperAI and contains human preferences for various tasks. It is employed for reinforcement learning from human feedback (RLHF) in the COFS-DPO method, with its task domain focusing on cross-domain learning.
提供机构:
CarperAI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作