five

billxbf/ultrafeedback-dpo-iter3

收藏
Hugging Face2025-11-12 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/billxbf/ultrafeedback-dpo-iter3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含提示信息、选择的对话内容、被拒绝的对话内容、完整对话消息以及是否交换偏好的布尔标记的对话数据集。数据集被划分为训练集,可用于对话系统的训练和评估。

This dataset is a dialogue dataset containing prompt information, selected dialogue content, rejected dialogue content, complete dialogue messages, and a boolean flag indicating whether preferences are swapped. The dataset is split into a training set, which can be used for the training and evaluation of dialogue systems.
提供机构:
billxbf
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作