DavidLanz/alpaca-gpt4-tw-input-output-48k
收藏Hugging Face2023-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DavidLanz/alpaca-gpt4-tw-input-output-48k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为alpaca-gpt4-tw-input-output-48k,包含由GPT-4生成的英语指令跟随数据,用于微调大型语言模型。数据集结构包括指令、输入和输出三个部分,其中输出由GPT-4生成。与原始Alpaca数据集相比,该数据集使用GPT-4生成响应,因此质量更高。数据集的大小在10K到100K之间,使用CC BY-NC 4.0许可。
提供机构:
DavidLanz
原始信息汇总
数据集卡片 "alpaca-gpt4-tw-input-output-48k"
数据集概述
该数据集包含由GPT-4使用Alpaca提示生成的英语指令遵循数据,用于微调大型语言模型(LLMs)。
数据集结构
数据集包含52K由GPT-4生成的指令遵循数据,使用与Alpaca相同的提示。数据格式如下:
instruction:str, 描述模型应执行的任务。52K条指令均唯一。input:str, 任务的可选上下文或输入。output:str, 由GPT-4生成的指令答案。
与原始Alpaca数据集的区别
原始Alpaca数据集使用text-davinci-003完成提示。该数据集使用相同的提示,但由GPT-4生成完成内容,因此响应的质量和长度通常更高。



