five

nlpai-lab/kullm-v2

收藏
Hugging Face2023-06-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlpai-lab/kullm-v2
下载链接
链接失效反馈
官方服务:
资源简介:
KULLM-v2数据集是将GPT4ALL、Dolly和Vicuna数据翻译成韩文的数据集。它包含了instruction、input和output字段,这些字段通过DeepL API进行了翻译。数据集的大小在10K到100K之间,适用于文本生成任务。

KULLM-v2数据集是将GPT4ALL、Dolly和Vicuna数据翻译成韩文的数据集。它包含了instruction、input和output字段,这些字段通过DeepL API进行了翻译。数据集的大小在10K到100K之间,适用于文本生成任务。
提供机构:
nlpai-lab
原始信息汇总

数据集卡片 for "KULLM-v2"

数据集概述

KULLM-v2 数据集是 GPT4ALL、Dolly 和 Vicuna 数据的韩语翻译版本。

数据集加载示例

python from datasets import load_dataset

ds = load_dataset("nlpai-lab/kullm-v2", split="train") ds

输出结果:

python DatasetDict({ train: Dataset({ features: [id, instruction, input, output], num_rows: 152630 }) })

数据样本示例

python ds[0]

输出结果:

python {id: alpaca_{idx}, instruction: 3원색이란 무엇인가요?, input: , output: 세 가지 기본 색은 빨강, 파랑, 노랑입니다. 이 색은 다른 색을 혼합하여 만들 수 없고 다른 모든 색은 다양한 비율로 조합하여 만들 수 있기 때문에 원색이라고 부릅니다. 빛에 사용되는 첨가제 색상 시스템에서 원색은 빨강, 녹색, 파랑(RGB)입니다.}

许可证

Apache-2.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作