pankajmathur/orca_minis_uncensored_dataset
收藏Hugging Face2023-07-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pankajmathur/orca_minis_uncensored_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过结合WizardLM、Alpaca和Dolly V-2的数据集,并采用Orca研究论文中的方法生成的,总共包含约104K条数据。这些数据使用了Orca研究论文中的15个系统指令,与原始数据集使用的普通指令调优方法不同。这种设计有助于学生模型(如orca_mini_v2_7b)从教师模型(ChatGPT,gpt-3.5-turbo-0301版本)中学习思维过程。
该数据集是通过结合WizardLM、Alpaca和Dolly V-2的数据集,并采用Orca研究论文中的方法生成的,总共包含约104K条数据。这些数据使用了Orca研究论文中的15个系统指令,与原始数据集使用的普通指令调优方法不同。这种设计有助于学生模型(如orca_mini_v2_7b)从教师模型(ChatGPT,gpt-3.5-turbo-0301版本)中学习思维过程。
提供机构:
pankajmathur
原始信息汇总
数据集概述
许可证
- 类型: CC-BY-NC-SA-4.0
任务类别
- 类别: 文本生成
语言
- 语言: 英语
大小类别
- 范围: 100K < n < 1M
数据集描述
- 来源: 由Orca Research Paper中的方法创建,结合了WizardLM、Alpaca和Dolly V-2的数据集。
- 规模: 约104,000条数据。
- 特点: 利用了Orca Research Paper中的15条系统指令,与原始数据集使用的普通指令调整方法不同。
- 目的: 帮助学生模型(如orca_mini_v2_7b)从教师模型(ChatGPT的gpt-3.5-turbo-0301版本)学习思考过程。
- 结构: 每条指令前都添加了系统提示。



