five

self_instruct

收藏
OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/self_instruct?tab=summary
下载链接
链接失效反馈
官方服务:
资源简介:
Self Instruct旨在提升语言模型遵循自然语言指令的能力,通过模型自身生成的数据来创建大型指令数据集,从而在无需大量人工标注的情况下改进语言模型的指令执行能力。它包含通过OpenAI的`davinci`引擎生成的52k条指令和82K条实例输入输出,可用于对语言模型进行指令微调。此外,还包含252个专家编写的、以用户为导向的任务及其指令,以及从P3和Super Natural Instructions数据集中抽取的50k个示例,用于实现公开数据集上的对比。数据集以英文呈现,并提供prompt和completion等字段,支持指令训练等任务。该数据集采用Apache-2.0许可协议。
提供机构:
AIWizards
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作