five

pankajmathur/orca_minis_uncensored_dataset

收藏
Hugging Face2023-07-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pankajmathur/orca_minis_uncensored_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过结合WizardLM、Alpaca和Dolly V-2的数据集,并采用Orca研究论文中的方法生成的,总共包含约104K条数据。这些数据使用了Orca研究论文中的15个系统指令,与原始数据集使用的普通指令调优方法不同。这种设计有助于学生模型(如orca_mini_v2_7b)从教师模型(ChatGPT,gpt-3.5-turbo-0301版本)中学习思维过程。

该数据集是通过结合WizardLM、Alpaca和Dolly V-2的数据集,并采用Orca研究论文中的方法生成的,总共包含约104K条数据。这些数据使用了Orca研究论文中的15个系统指令,与原始数据集使用的普通指令调优方法不同。这种设计有助于学生模型(如orca_mini_v2_7b)从教师模型(ChatGPT,gpt-3.5-turbo-0301版本)中学习思维过程。
提供机构:
pankajmathur
原始信息汇总

数据集概述

许可证

  • 类型: CC-BY-NC-SA-4.0

任务类别

  • 类别: 文本生成

语言

  • 语言: 英语

大小类别

  • 范围: 100K < n < 1M

数据集描述

  • 来源: 由Orca Research Paper中的方法创建,结合了WizardLM、Alpaca和Dolly V-2的数据集。
  • 规模: 约104,000条数据。
  • 特点: 利用了Orca Research Paper中的15条系统指令,与原始数据集使用的普通指令调整方法不同。
  • 目的: 帮助学生模型(如orca_mini_v2_7b)从教师模型(ChatGPT的gpt-3.5-turbo-0301版本)学习思考过程。
  • 结构: 每条指令前都添加了系统提示。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作