five

jondurbin/airoboros-gpt4-1.3

收藏
Hugging Face2023-06-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jondurbin/airoboros-gpt4-1.3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是gpt4-1.2的延续,包含了所有编码指令的PLAINFORMAT版本,数千个新的orca风格提示,以及一些对话/角色互动的示例。需要注意的是,数据集中有些内容的长度超过了2048个token,使用时应谨慎。数据集仅用于研究用途,不能用于商业用途。

该数据集是gpt4-1.2的延续,包含了所有编码指令的PLAINFORMAT版本,数千个新的orca风格提示,以及一些对话/角色互动的示例。需要注意的是,数据集中有些内容的长度超过了2048个token,使用时应谨慎。数据集仅用于研究用途,不能用于商业用途。
提供机构:
jondurbin
原始信息汇总

数据集概述

本数据集是gpt4-1.2的延续,具有以下特点:

  • 所有编码指令现在都有一个等效的“PLAINFORMAT”版本。
  • 新增数千个orca风格的提示,这次是先推理,后响应。
  • 包含多个对话/角色交互的示例,带有星号标记的动作和引用的对话。

注意:本数据集未根据令牌长度进行过滤,部分数据超过2048个令牌,使用时需谨慎。

使用和许可通知

所有airoboros模型和数据集仅供研究使用,并根据cc-nc-4.0许可,但由于以下原因,实际上受限于自定义/特殊许可:

  • 基础模型为LLaMa,其拥有自己的特殊研究许可。
  • 数据集由OpenAI(gpt-4和/或gpt-3.5-turbo)生成,该数据不能用于创建与OpenAI竞争的模型。

再次强调:本模型(及数据集)不可用于商业用途。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作