nlpai-lab/kullm-v2
收藏Hugging Face2023-06-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlpai-lab/kullm-v2
下载链接
链接失效反馈官方服务:
资源简介:
KULLM-v2数据集是将GPT4ALL、Dolly和Vicuna数据翻译成韩文的数据集。它包含了instruction、input和output字段,这些字段通过DeepL API进行了翻译。数据集的大小在10K到100K之间,适用于文本生成任务。
KULLM-v2数据集是将GPT4ALL、Dolly和Vicuna数据翻译成韩文的数据集。它包含了instruction、input和output字段,这些字段通过DeepL API进行了翻译。数据集的大小在10K到100K之间,适用于文本生成任务。
提供机构:
nlpai-lab
原始信息汇总
数据集卡片 for "KULLM-v2"
数据集概述
KULLM-v2 数据集是 GPT4ALL、Dolly 和 Vicuna 数据的韩语翻译版本。
数据集加载示例
python from datasets import load_dataset
ds = load_dataset("nlpai-lab/kullm-v2", split="train") ds
输出结果:
python DatasetDict({ train: Dataset({ features: [id, instruction, input, output], num_rows: 152630 }) })
数据样本示例
python ds[0]
输出结果:
python {id: alpaca_{idx}, instruction: 3원색이란 무엇인가요?, input: , output: 세 가지 기본 색은 빨강, 파랑, 노랑입니다. 이 색은 다른 색을 혼합하여 만들 수 없고 다른 모든 색은 다양한 비율로 조합하여 만들 수 있기 때문에 원색이라고 부릅니다. 빛에 사용되는 첨가제 색상 시스템에서 원색은 빨강, 녹색, 파랑(RGB)입니다.}
许可证
Apache-2.0



