five

InstructWild

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/InstructWild
下载链接
链接失效反馈
官方服务:
资源简介:
指令调整是ChatGPT的关键组成部分。OpenAI使用他们的基于用户的指令数据集,但不幸的是,这个数据集不是开源的。Self-instruction发布了由175人工编写的指令组成的小指令数据集。斯坦福羊驼团队text-davinci-003从上述175个种子指令中按模型生成了52k指令。 该项目的目标是一个更大、更多样化的指令数据集。为此,我们从ChatGPT使用截图中收集了429个描述,并发布了中英文版本。我们发现这些指令非常多样化,即使规模仍然很小。我们跟随羊驼生成52k命令及其响应。所有数据都可以在目录数据中找到。 注意: 这是一个正在进行的项目。我们仍在收集和改进我们的数据。我们提前发布这个数据集,以加速我们的LLM研究。我们还将很快发表白皮书。
提供机构:
OpenDataLab
创建时间:
2023-04-26
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作