wisenut-nlp-team/llama_ko_gen

Name: wisenut-nlp-team/llama_ko_gen
Creator: wisenut-nlp-team
Published: 2024-05-07 06:26:27
License: 暂无描述

Hugging Face2024-05-07 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/wisenut-nlp-team/llama_ko_gen

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: - config_name: commonGen features: - name: instruction dtype: string - name: input dtype: string - name: output dtype: string splits: - name: train num_bytes: 324134869 num_examples: 1741252 dataset_size: 324134869 configs: - config_name: commonGen data_files: - split: train path: commonGen/* --- - [일반 상식 문장 생성](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71309) - length: 914.62k - [일반 상식 문장 생성 평가](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71311) - length: 737.53k - [KommonGen](https://github.com/nlpai-lab/KommonGen) - length: 89.11k

数据集元信息： - 配置名称：commonGen - 特征字段： - 字段名称：指令（instruction），数据类型：字符串（string） - 字段名称：输入（input），数据类型：字符串（string） - 字段名称：输出（output），数据类型：字符串（string） - 数据集划分： - 划分集名称：训练集（train），字节占用：324134869，样本数量：1741252 - 数据集总大小：324134869字节配置项： - 配置名称：commonGen，数据文件： - 划分集：训练集（train），文件路径：commonGen/* --- - [日常常识语句生成数据集](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71309) - 数据量：914.62k - [日常常识语句生成评测数据集](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71311) - 数据量：737.53k - [KommonGen](https://github.com/nlpai-lab/KommonGen) - 数据量：89.11k

提供机构：

wisenut-nlp-team

原始信息汇总

数据集概述

数据集名称

config_name: commonGen

数据集特征

instruction: 数据类型为字符串
input: 数据类型为字符串
output: 数据类型为字符串

数据集划分

train:
- num_bytes: 324134869
- num_examples: 1741252

数据集大小

dataset_size: 324134869

5,000+

优质数据集

54 个

任务类型

进入经典数据集