HuggingFaceH4/orca_dpo_pairs
收藏Hugging Face2024-04-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HuggingFaceH4/orca_dpo_pairs
下载链接
链接失效反馈官方服务:
资源简介:
OrcaDPO Pair数据集是OpenOrca数据集的一个子集,专门用于DPO偏好调优。数据集包含prompt、chosen和rejected三个部分,分别表示提示、被选择的回答和被拒绝的回答。数据集分为train_prefs和test_prefs两个部分,分别包含12359和500个样本。数据集的创建目的是为研究人员和开发者提供增强的文本数据,特别是用于增强FLAN Collection数据的推理能力。数据集的使用场景包括语言理解、自然语言处理、机器学习模型训练和模型性能评估。
提供机构:
HuggingFaceH4
原始信息汇总
数据集概述
数据集名称
- OpenOrca数据集的预处理版本
数据集描述
- 该数据集是OpenOrca数据集的一个预处理版本,具体预处理步骤未详细说明。



