five

DavidLanz/alpaca-gpt4-tw-input-output-48k

收藏
Hugging Face2023-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DavidLanz/alpaca-gpt4-tw-input-output-48k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为alpaca-gpt4-tw-input-output-48k,包含由GPT-4生成的英语指令跟随数据,用于微调大型语言模型。数据集结构包括指令、输入和输出三个部分,其中输出由GPT-4生成。与原始Alpaca数据集相比,该数据集使用GPT-4生成响应,因此质量更高。数据集的大小在10K到100K之间,使用CC BY-NC 4.0许可。
提供机构:
DavidLanz
原始信息汇总

数据集卡片 "alpaca-gpt4-tw-input-output-48k"

数据集概述

该数据集包含由GPT-4使用Alpaca提示生成的英语指令遵循数据,用于微调大型语言模型(LLMs)。

数据集结构

数据集包含52K由GPT-4生成的指令遵循数据,使用与Alpaca相同的提示。数据格式如下:

  • instruction: str, 描述模型应执行的任务。52K条指令均唯一。
  • input: str, 任务的可选上下文或输入。
  • output: str, 由GPT-4生成的指令答案。

与原始Alpaca数据集的区别

原始Alpaca数据集使用text-davinci-003完成提示。该数据集使用相同的提示,但由GPT-4生成完成内容,因此响应的质量和长度通常更高。

许可信息

数据集遵循Creative Commons NonCommercial (CC BY-NC 4.0)许可。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作