Databricks Dolly 15k
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/databrickslabs/dolly
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是由Databricks员工众包生成的,包含15,000个人工生成的提示/回应对,质量上乘。在此基础上,Dolly-V2模型被针对研究和商业用途进行了微调,任务是对AI模型的指令跟随。
This dataset was crowdsourced by Databricks employees, containing 15,000 high-quality human-generated prompt/response pairs. Based on this dataset, the Dolly-V2 model was fine-tuned for both research and commercial applications, with the task focused on AI instruction following.
提供机构:
Databricks
搜集汇总
数据集介绍

背景与挑战
背景概述
Databricks Dolly 15k是一个包含约15k条指令/响应记录的数据集,用于训练基于pythia-12b的Dolly模型,支持商业使用。数据集涵盖多个能力领域,但存在性能和数据集偏见等局限性。
以上内容由遇见数据集搜集并总结生成



