Uni-DPO

Name: Uni-DPO
Creator: maas
Published: 2026-05-16 21:32:16
License: 暂无描述

魔搭社区2026-05-16 更新2026-05-17 收录

下载链接：

https://modelscope.cn/datasets/pspdada/Uni-DPO

下载链接

链接失效反馈

官方服务：

资源简介：

Uni-DPO 提出一种统一的动态偏好优化范式，用于基于偏好数据训练大语言模型。不同于以往将所有偏好样本等同处理的 DPO 方法，Uni-DPO 同时考虑：偏好数据自身质量与模型学习动态，从而实现更有效、更稳健的偏好学习。

提供机构：

maas

创建时间：

2026-02-12

5,000+

优质数据集

54 个

任务类型

进入经典数据集