Alpaca-Cleaned 指令微调数据集
收藏超神经2024-08-23 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/33618
下载链接
链接失效反馈官方服务:
资源简介:
Alpaca-Cleaned 数据集是对斯坦福大学于 2024 年发布的原始 Alpaca 数据集的清理版本。原始 Alpaca 是一个包含 52,000 条指令和演示的数据集,这些指令和演示由 OpenAI (text-davinci-003) 的引擎生成。此指令数据可用于对语言模型进行指令调整,从而使语言模型更好地遵循指令。
The Alpaca-Cleaned dataset is a cleaned version of the original Alpaca dataset released by Stanford University in 2024. The original Alpaca dataset contains 52,000 instructions and demonstrations generated by OpenAI's text-davinci-003 engine. This instruction data can be used to perform instruction tuning on language models, enabling the models to better follow human instructions.
创建时间:
2024-08-20
搜集汇总
数据集介绍

背景与挑战
背景概述
Alpaca-Cleaned是一个包含52,000条指令和演示的清理版本数据集,用于语言模型的指令调整,以提高模型遵循指令的能力。该数据集解决了原始数据中的幻觉性回答、合并指令等问题,适用于文本生成、问答系统等多种NLP应用场景。
以上内容由遇见数据集搜集并总结生成



