Databricks-dolly-15k
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Databricks-dolly-15k
下载链接
链接失效反馈官方服务:
资源简介:
Databricks-dolly-15k是由数千名Databricks员工生成的15,000多个记录的语料库,使大型语言模型能够展示ChatGPT惊人的交互性。Databricks的员工被邀请在八个不同的指令类别 (包括InstructGPT论文中概述的七个指令类别) 中创建提示/响应对,以及一个开放式的自由形式类别。指示贡献者避免使用除维基百科 (针对命令类别的特定子集) 以外的网络上任何来源的信息,并明确指示贡献者避免在制定命令或响应时使用生成AI。提供了每种行为的示例,以激发适合每个类别的问题类型和说明。
提供机构:
OpenDataLab
创建时间:
2023-04-26
搜集汇总
数据集介绍

背景与挑战
背景概述
Databricks-dolly-15k是一个由Databricks员工创建的包含15,000条记录的语料库,旨在提升大型语言模型的交互能力。该数据集涵盖八个指令类别,包括InstructGPT论文中的七个类别和一个开放式类别,并要求贡献者避免使用生成AI和维基百科以外的网络信息来生成提示和响应。
以上内容由遇见数据集搜集并总结生成



