five

distilabel-truthy-dpo-v0.1

收藏
魔搭社区2025-10-09 更新2025-03-22 收录
下载链接:
https://modelscope.cn/datasets/mlabonne/distilabel-truthy-dpo-v0.1
下载链接
链接失效反馈
官方服务:
资源简介:
# distilabel-truthy-dpo-v0.1 A DPO dataset built with [distilabel](https://github.com/argilla-io/distilabel) on top of Jon Durbin's [jondurbin/truthy-dpo-v0.1](https://huggingface.co/datasets/jondurbin/truthy-dpo-v0.1) dataset. Interestingly, it swaps a lot of chosen and rejected answers.

# distilabel-truthy-dpo-v0.1 本数据集为基于Jon Durbin发布的[jondurbin/truthy-dpo-v0.1](https://huggingface.co/datasets/jondurbin/truthy-dpo-v0.1)数据集,使用[distilabel](https://github.com/argilla-io/distilabel)工具构建的DPO(Direct Preference Optimization)数据集。 值得注意的是,该数据集对大量优选回答(chosen)与劣选回答(rejected)进行了交换。
提供机构:
maas
创建时间:
2025-03-18
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是基于Jon Durbin的'truthy-dpo-v0.1'数据集,使用distilabel工具构建的DPO数据集。其特点在于交换了许多选定和拒绝的答案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作