five

Takuuu1/qwen25-lima-pairrm-preferences

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Takuuu1/qwen25-lima-pairrm-preferences
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于偏好学习的数据集,包含指令、提示、选择响应和拒绝响应等字段,适用于训练对话模型或指令遵循模型。数据集中每个样本包括一个指令、一个由角色和内容组成的提示列表、一个被选中的响应列表(包含内容和角色)、一个被拒绝的响应列表(包含内容和角色),以及所有响应的序列、配对排名信息、选择索引、拒绝索引、选择排名、拒绝排名、来源数据集、生成模型、候选数量和种子等元数据。数据集共有64个训练样本,旨在通过对比选择与拒绝的响应来优化模型性能。

This dataset is designed for preference learning, featuring fields such as instruction, prompt, chosen response, and rejected response, suitable for training dialogue models or instruction-following models. Each sample includes an instruction, a prompt list with role and content, a chosen response list (with content and role), a rejected response list (with content and role), along with sequences of all responses, pair ranking information, chosen index, rejected index, chosen rank, rejected rank, source dataset, generator model, number of candidates, and seed metadata. The dataset contains 64 training examples, aiming to optimize model performance by contrasting chosen and rejected responses.
提供机构:
Takuuu1
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作