pankajmathur/orca_minis_uncensored_dataset

Name: pankajmathur/orca_minis_uncensored_dataset
Creator: pankajmathur
Published: 2023-07-04 05:56:20
License: 暂无描述

Hugging Face2023-07-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/pankajmathur/orca_minis_uncensored_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是通过结合WizardLM、Alpaca和Dolly V-2的数据集，并采用Orca研究论文中的方法生成的，总共包含约104K条数据。这些数据使用了Orca研究论文中的15个系统指令，与原始数据集使用的普通指令调优方法不同。这种设计有助于学生模型（如orca_mini_v2_7b）从教师模型（ChatGPT，gpt-3.5-turbo-0301版本）中学习思维过程。

提供机构：

pankajmathur

原始信息汇总

数据集概述

许可证

类型: CC-BY-NC-SA-4.0

任务类别

类别: 文本生成

语言

语言: 英语

大小类别

范围: 100K < n < 1M

数据集描述

来源: 由Orca Research Paper中的方法创建，结合了WizardLM、Alpaca和Dolly V-2的数据集。
规模: 约104,000条数据。
特点: 利用了Orca Research Paper中的15条系统指令，与原始数据集使用的普通指令调整方法不同。
目的: 帮助学生模型（如orca_mini_v2_7b）从教师模型（ChatGPT的gpt-3.5-turbo-0301版本）学习思考过程。
结构: 每条指令前都添加了系统提示。

5,000+

优质数据集

54 个

任务类型

进入经典数据集