five

Bingsu/ko_alpaca_data

收藏
Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Bingsu/ko_alpaca_data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是对alpaca data的韩语翻译版本,主要用于文本生成任务。数据集包含49,620个训练样本,每个样本包括instruction、input和output三个字段,数据类型均为字符串。数据集的下载大小为8.49 MB,生成的数据集大小为13.79 MB。数据集的许可证为CC-BY-NC-4.0,主要语言为韩语。数据集的生成过程包括使用DeepL API翻译instruction和input字段,并通过OpenAI ChatGPT API生成output字段。生成输出数据时使用了特定的提示模板,以确保生成的回答符合要求。

该数据集是对alpaca data的韩语翻译版本,主要用于文本生成任务。数据集包含49,620个训练样本,每个样本包括instruction、input和output三个字段,数据类型均为字符串。数据集的下载大小为8.49 MB,生成的数据集大小为13.79 MB。数据集的许可证为CC-BY-NC-4.0,主要语言为韩语。数据集的生成过程包括使用DeepL API翻译instruction和input字段,并通过OpenAI ChatGPT API生成output字段。生成输出数据时使用了特定的提示模板,以确保生成的回答符合要求。
提供机构:
Bingsu
原始信息汇总

数据集概述

数据集名称

  • pretty_name: ko-alpaca-data

语言

  • language: ko (韩语)

数据集大小

  • size_categories: 10K<n<100K

任务类别

  • task_categories: text-generation

数据集特征

  • features:
    • instruction: string
    • input: string
    • output: string

数据集拆分

  • splits:
    • train:
      • num_examples: 49620
      • num_bytes: 13791136

许可证

  • license: CC-BY-NC-4.0

数据集大小

  • download_size: 8491044
  • dataset_size: 13791136
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作