alvarobartt/openhermes-preferences-coding
收藏Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/openhermes-preferences-coding
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从`argilla/OpenHermesPreferences`中提取的一个子集,专门保留了与编码相关的偏好数据,并移除了除`chosen`和`rejected`之外的所有列,这些列以OpenAI聊天格式呈现,便于使用如`huggingface/alignment-handbook`或`axolotl`等工具进行模型微调。
该数据集是从`argilla/OpenHermesPreferences`中提取的一个子集,专门保留了与编码相关的偏好数据,并移除了除`chosen`和`rejected`之外的所有列,这些列以OpenAI聊天格式呈现,便于使用如`huggingface/alignment-handbook`或`axolotl`等工具进行模型微调。
提供机构:
alvarobartt
原始信息汇总
数据集卡片 - OpenHermes Preferences - Coding
数据集概述
该数据集是 argilla/OpenHermesPreferences 的一个子集,仅保留了源数据中的 coding 偏好,并移除了除 chosen 和 rejected 之外的所有列。这些数据采用 OpenAI 聊天格式,便于使用工具如 huggingface/alignment-handbook 或 axolotl 进行模型微调。
数据集信息
特征
- chosen
- content: 字符串类型
- role: 字符串类型
- rejected
- content: 字符串类型
- role: 字符串类型
分割
- train
- 字节数: 16413529.407579662
- 样本数: 4914
- test
- 字节数: 1823725.4897310736
- 样本数: 546
大小
- 下载大小: 9035702
- 数据集大小: 18237254.897310738
配置
- default
- train
- 路径: data/train-*
- test
- 路径: data/test-*
- train
参考
该数据集由 Argilla 和 HuggingFaceH4 团队(来自 HuggingFace)合作创建。



