five

52K demonstrations used to fine-tune Alpaca

收藏
OpenDataLab2026-05-31 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/52K_demonstrations_used_to_fine-tune_etc
下载链接
链接失效反馈
官方服务:
资源简介:
在学术预算下训练高质量的教学遵循模型有两个重要的挑战: 强大的预先训练的语言模型和高质量的教学遵循数据。第一个挑战是通过最近发布的Meta的新美洲驼模型来解决的。对于第二个挑战,自我指导论文建议使用现有的强语言模型来自动生成指令数据。特别地,羊驼是一种语言模型,使用从OpenAI text-davinci-003生成的52k指令跟随演示从LLaMA 7B模型进行监督学习进行微调。

Training high-quality instruction-following models under an academic budget faces two critical challenges: securing a powerful pre-trained language model and curating high-quality instruction-following datasets. The first challenge is addressed by Meta's newly released LLaMA model. For the second challenge, the Self-Instruct paper proposes using existing state-of-the-art language models to automatically generate instruction tuning data. Specifically, Alpaca, a language model fine-tuned from the LLaMA 7B base model through supervised learning, utilizes 52k instruction-following demonstrations generated by OpenAI's text-davinci-003.
提供机构:
OpenDataLab
创建时间:
2023-04-26
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集由斯坦福大学于2023年发布,包含52k条指令跟随演示,用于从LLaMA 7B模型微调Alpaca语言模型,旨在解决高质量教学遵循数据的挑战。它基于自我指导方法,通过强语言模型自动生成数据,以提升模型性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作