distilabel-truthy-dpo-v0.1
收藏魔搭社区2025-10-09 更新2025-03-22 收录
下载链接:
https://modelscope.cn/datasets/mlabonne/distilabel-truthy-dpo-v0.1
下载链接
链接失效反馈官方服务:
资源简介:
# distilabel-truthy-dpo-v0.1
A DPO dataset built with [distilabel](https://github.com/argilla-io/distilabel) on top of Jon Durbin's [jondurbin/truthy-dpo-v0.1](https://huggingface.co/datasets/jondurbin/truthy-dpo-v0.1) dataset.
Interestingly, it swaps a lot of chosen and rejected answers.
# distilabel-truthy-dpo-v0.1
本数据集为基于Jon Durbin发布的[jondurbin/truthy-dpo-v0.1](https://huggingface.co/datasets/jondurbin/truthy-dpo-v0.1)数据集,使用[distilabel](https://github.com/argilla-io/distilabel)工具构建的DPO(Direct Preference Optimization)数据集。
值得注意的是,该数据集对大量优选回答(chosen)与劣选回答(rejected)进行了交换。
提供机构:
maas
创建时间:
2025-03-18
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是基于Jon Durbin的'truthy-dpo-v0.1'数据集,使用distilabel工具构建的DPO数据集。其特点在于交换了许多选定和拒绝的答案。
以上内容由遇见数据集搜集并总结生成



