five

InstructGPT-sft

收藏
arXiv2022-03-01 更新2025-02-10 收录
下载链接:
https://arxiv.org/pdf/2203.02155
下载链接
链接失效反馈
资源简介:
InstructGPT-sft数据集用于微调InstructGPT模型,包含1.4万条指令。数据集的一部分来源于平台上的用户数据,另一部分由40名经过培训的标注员通过创建简单任务、提供少样本任务以及撰写指令的过程生成。目前,该数据集尚未开源。

The InstructGPT-sft dataset, which contains 14,000 instruction samples, is used for fine-tuning the InstructGPT model. Part of the dataset comes from user-generated data on the platform, while the other part is generated by 40 trained annotators through creating simple tasks, providing few-shot tasks and drafting instructions. Currently, this dataset has not been open-sourced.
提供机构:
OpenAI
创建时间:
2022-03-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作