billxbf/ultrafeedback-dpo-iter3
收藏Hugging Face2025-11-12 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/billxbf/ultrafeedback-dpo-iter3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含提示信息、选择的对话内容、被拒绝的对话内容、完整对话消息以及是否交换偏好的布尔标记的对话数据集。数据集被划分为训练集,可用于对话系统的训练和评估。
This dataset is a dialogue dataset containing prompt information, selected dialogue content, rejected dialogue content, complete dialogue messages, and a boolean flag indicating whether preferences are swapped. The dataset is split into a training set, which can be used for the training and evaluation of dialogue systems.
提供机构:
billxbf



