five

InfinityInstruct-3M 启动千万级指令微调数据集

收藏
超神经2024-06-21 更新2024-06-29 收录
下载链接:
https://hyper.ai/cn/datasets/32441
下载链接
链接失效反馈
官方服务:
资源简介:
InfinityInstruct 是由北京智源人工智能研究院 (Beijing Academy of Artificial Intelligence, BAAI) 推出的一个大规模、高质量的开源指令微调数据集项目。该项目的目标是开发一个包含数百万条指令的数据集,以支持大型语言模型的指令跟踪能力,进而提升模型性能。

InfinityInstruct is a large-scale, high-quality open-source instruction tuning dataset project launched by the Beijing Academy of Artificial Intelligence (BAAI). The project aims to develop a dataset containing millions of instruction entries to support the instruction-following capabilities of large language models, thereby enhancing model performance.
创建时间:
2024-06-14
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
InfinityInstruct-3M是由北京智源人工智能研究院推出的大规模、高质量开源指令微调数据集,包含300万条中英文指令数据,旨在提升大型语言模型的指令跟踪能力。该数据集通过高质量筛选和社区贡献构建,预计未来扩展至千万级规模,并有望达到GPT-4水平的模型性能。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务