jondurbin/airoboros-3.2
收藏Hugging Face2024-01-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jondurbin/airoboros-3.2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是airoboros-3.1的延续,主要变化包括移除了MathJSON,重新添加了去审查数据,并扩展了slimorca的指令以增强多轮对话能力。数据格式已更改为ShareGPT格式以适应OS生态系统微调工具。使用该数据集时需注意,其中可能包含有害内容,且内容不代表个人观点,用户需确保使用合法性并承担全部责任。
提供机构:
jondurbin
原始信息汇总
概述
该数据集是airoboros-3.1的延续,具体变化如下:
- 暂时移除了MathJSON,因为它有时会使模型混淆,造成的问题多于其价值。MathJSON数据集可以在这里找到。
- 重新添加了去审查数据,以确保使用此数据集的非DPO SFT模型相对未经审查。
- 从slimorca扩展了约11k条指令,增加了额外的后续轮次,以增强多轮对话能力。
格式
数据集现在采用ShareGPT格式,以便更好地适应OS生态系统的微调工具。
使用限制
使用此数据集时,您必须确认/同意以下事项:
- 数据集中包含一小部分“有毒”/“有害”内容,包括亵渎和其他类型的敏感内容。
- 数据集中的内容或观点不一定与我的个人信仰或观点一致,它们只是LLM生成的文本,未经大量验证。
- 您能够依法使用该数据集,特别是在言论自由法律较少的地区。
- 您独自负责下载和使用该数据集,我完全免除任何和所有责任。
此外,请注意该数据主要由gpt-4生成,因此可能附带OpenAI服务条款的某些限制。



