five

jondurbin/airoboros-3.2

收藏
Hugging Face2024-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jondurbin/airoboros-3.2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是airoboros-3.1的延续,主要变化包括移除了MathJSON,重新添加了去审查数据,并扩展了slimorca的指令以增强多轮对话能力。数据格式已更改为ShareGPT格式以适应OS生态系统微调工具。使用该数据集时需注意,其中可能包含有害内容,且内容不代表个人观点,用户需确保使用合法性并承担全部责任。
提供机构:
jondurbin
原始信息汇总

概述

该数据集是airoboros-3.1的延续,具体变化如下:

  • 暂时移除了MathJSON,因为它有时会使模型混淆,造成的问题多于其价值。MathJSON数据集可以在这里找到。
  • 重新添加了去审查数据,以确保使用此数据集的非DPO SFT模型相对未经审查。
  • slimorca扩展了约11k条指令,增加了额外的后续轮次,以增强多轮对话能力。

格式

数据集现在采用ShareGPT格式,以便更好地适应OS生态系统的微调工具。

使用限制

使用此数据集时,您必须确认/同意以下事项:

  • 数据集中包含一小部分“有毒”/“有害”内容,包括亵渎和其他类型的敏感内容。
  • 数据集中的内容或观点不一定与我的个人信仰或观点一致,它们只是LLM生成的文本,未经大量验证。
  • 您能够依法使用该数据集,特别是在言论自由法律较少的地区。
  • 您独自负责下载和使用该数据集,我完全免除任何和所有责任。

此外,请注意该数据主要由gpt-4生成,因此可能附带OpenAI服务条款的某些限制。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作