Bingsu/ko_alpaca_data
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Bingsu/ko_alpaca_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是对alpaca data的韩语翻译版本,主要用于文本生成任务。数据集包含49,620个训练样本,每个样本包括instruction、input和output三个字段,数据类型均为字符串。数据集的下载大小为8.49 MB,生成的数据集大小为13.79 MB。数据集的许可证为CC-BY-NC-4.0,主要语言为韩语。数据集的生成过程包括使用DeepL API翻译instruction和input字段,并通过OpenAI ChatGPT API生成output字段。生成输出数据时使用了特定的提示模板,以确保生成的回答符合要求。
该数据集是对alpaca data的韩语翻译版本,主要用于文本生成任务。数据集包含49,620个训练样本,每个样本包括instruction、input和output三个字段,数据类型均为字符串。数据集的下载大小为8.49 MB,生成的数据集大小为13.79 MB。数据集的许可证为CC-BY-NC-4.0,主要语言为韩语。数据集的生成过程包括使用DeepL API翻译instruction和input字段,并通过OpenAI ChatGPT API生成output字段。生成输出数据时使用了特定的提示模板,以确保生成的回答符合要求。
提供机构:
Bingsu
原始信息汇总
数据集概述
数据集名称
- pretty_name: ko-alpaca-data
语言
- language: ko (韩语)
数据集大小
- size_categories: 10K<n<100K
任务类别
- task_categories: text-generation
数据集特征
- features:
- instruction: string
- input: string
- output: string
数据集拆分
- splits:
- train:
- num_examples: 49620
- num_bytes: 13791136
- train:
许可证
- license: CC-BY-NC-4.0
数据集大小
- download_size: 8491044
- dataset_size: 13791136



