self_instruct
收藏OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/self_instruct?tab=summary
下载链接
链接失效反馈官方服务:
资源简介:
Self Instruct旨在提升语言模型遵循自然语言指令的能力,通过模型自身生成的数据来创建大型指令数据集,从而在无需大量人工标注的情况下改进语言模型的指令执行能力。它包含通过OpenAI的`davinci`引擎生成的52k条指令和82K条实例输入输出,可用于对语言模型进行指令微调。此外,还包含252个专家编写的、以用户为导向的任务及其指令,以及从P3和Super Natural Instructions数据集中抽取的50k个示例,用于实现公开数据集上的对比。数据集以英文呈现,并提供prompt和completion等字段,支持指令训练等任务。该数据集采用Apache-2.0许可协议。
提供机构:
AIWizards
创建时间:
2024-07-19



