llm-wizard/alpaca-gpt4-data-zh

Name: llm-wizard/alpaca-gpt4-data-zh
Creator: llm-wizard
Published: 2023-05-03 17:56:55
License: 暂无描述

Hugging Face2023-05-03 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/llm-wizard/alpaca-gpt4-data-zh

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为alpaca-gpt4-data-zh，主要用于指令调优任务，特别是与GPT-4相关的文本生成任务。数据集包含指令、输入和输出三个特征，训练集包含48,818个样本，总大小为32,150,579字节。数据集使用CC BY NC 4.0许可证，仅限非商业研究用途。数据集的语言为中文，任务类别为文本生成，标签包括GPT、Alpaca、微调、指令调优和指令。

提供机构：

llm-wizard

原始信息汇总

数据集概述

基本信息

名称: Instruction Tuning with GPT-4
语言: 中文 (zh)
大小: 10K<n<100K
任务类别: 文本生成 (text-generation)
许可证: CC-BY-4.0

数据集结构

特征:
- instruction: 数据类型为字符串
- input: 数据类型为字符串
- output: 数据类型为字符串

数据集拆分

训练集:
- 示例数量: 48818
- 字节数: 32150579

下载与数据集大小

下载大小: 35100559字节
数据集大小: 32150579字节