five

alvarobartt/openhermes-preferences-coding

收藏
Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alvarobartt/openhermes-preferences-coding
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从`argilla/OpenHermesPreferences`中提取的一个子集,专门保留了与编码相关的偏好数据,并移除了除`chosen`和`rejected`之外的所有列,这些列以OpenAI聊天格式呈现,便于使用如`huggingface/alignment-handbook`或`axolotl`等工具进行模型微调。

该数据集是从`argilla/OpenHermesPreferences`中提取的一个子集,专门保留了与编码相关的偏好数据,并移除了除`chosen`和`rejected`之外的所有列,这些列以OpenAI聊天格式呈现,便于使用如`huggingface/alignment-handbook`或`axolotl`等工具进行模型微调。
提供机构:
alvarobartt
原始信息汇总

数据集卡片 - OpenHermes Preferences - Coding

数据集概述

该数据集是 argilla/OpenHermesPreferences 的一个子集,仅保留了源数据中的 coding 偏好,并移除了除 chosenrejected 之外的所有列。这些数据采用 OpenAI 聊天格式,便于使用工具如 huggingface/alignment-handbookaxolotl 进行模型微调。

数据集信息

特征

  • chosen
    • content: 字符串类型
    • role: 字符串类型
  • rejected
    • content: 字符串类型
    • role: 字符串类型

分割

  • train
    • 字节数: 16413529.407579662
    • 样本数: 4914
  • test
    • 字节数: 1823725.4897310736
    • 样本数: 546

大小

  • 下载大小: 9035702
  • 数据集大小: 18237254.897310738

配置

  • default
    • train
      • 路径: data/train-*
    • test
      • 路径: data/test-*

参考

该数据集由 Argilla 和 HuggingFaceH4 团队(来自 HuggingFace)合作创建。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作