CorticalStack/tak-stack-dpo
收藏Hugging Face2024-02-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CorticalStack/tak-stack-dpo
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于微调开源大型语言模型(LLMs)的DPO对齐数据集,包含了来自不同数据集的样本偏好对,以增加多样性。数据集采用标准的指令、选择和拒绝格式,并包含一个来源特征,指示每行数据是从哪个数据集中提取的。
这是一个用于微调开源大型语言模型(LLMs)的DPO对齐数据集,包含了来自不同数据集的样本偏好对,以增加多样性。数据集采用标准的指令、选择和拒绝格式,并包含一个来源特征,指示每行数据是从哪个数据集中提取的。
提供机构:
CorticalStack
原始信息汇总
tak-stack-dpo 数据集概述
基本信息
- 语言: 英语
- 许可证: Apache 2.0
- 任务类别: 文本生成
- 数据集别名: tak-stack-dpo
- 标签: 合成, DPO
数据集详情
- 特征:
- source: 字符串类型
- instruction: 字符串类型
- chosen: 字符串类型
- rejected: 字符串类型
- 样本数量: 10856
- 数据集大小: 14401432 字节
数据集描述
- 格式: 标准格式,包含 instruction、chosen 和 rejected 字段,以及 source 字段指示数据行来自哪个数据集。
- 来源数据集:
- argilla/distilabel-math-preference-dpo
- jondurbin/truthy-dpo-v0.1
- argilla/distilabel-intel-orca-dpo-pairs
- argilla/OpenHermes2.5-dpo-binarized-alpha



