wisenut-nlp-team/llama_ko_gen
收藏Hugging Face2024-05-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/wisenut-nlp-team/llama_ko_gen
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: commonGen
features:
- name: instruction
dtype: string
- name: input
dtype: string
- name: output
dtype: string
splits:
- name: train
num_bytes: 324134869
num_examples: 1741252
dataset_size: 324134869
configs:
- config_name: commonGen
data_files:
- split: train
path: commonGen/*
---
- [일반 상식 문장 생성](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71309)
- length: 914.62k
- [일반 상식 문장 생성 평가](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71311)
- length: 737.53k
- [KommonGen](https://github.com/nlpai-lab/KommonGen)
- length: 89.11k
数据集元信息:
- 配置名称:commonGen
- 特征字段:
- 字段名称:指令(instruction),数据类型:字符串(string)
- 字段名称:输入(input),数据类型:字符串(string)
- 字段名称:输出(output),数据类型:字符串(string)
- 数据集划分:
- 划分集名称:训练集(train),字节占用:324134869,样本数量:1741252
- 数据集总大小:324134869字节
配置项:
- 配置名称:commonGen,数据文件:
- 划分集:训练集(train),文件路径:commonGen/*
---
- [日常常识语句生成数据集](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71309)
- 数据量:914.62k
- [日常常识语句生成评测数据集](https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71311)
- 数据量:737.53k
- [KommonGen](https://github.com/nlpai-lab/KommonGen)
- 数据量:89.11k
提供机构:
wisenut-nlp-team
原始信息汇总
数据集概述
数据集名称
- config_name: commonGen
数据集特征
- instruction: 数据类型为字符串
- input: 数据类型为字符串
- output: 数据类型为字符串
数据集划分
- train:
- num_bytes: 324134869
- num_examples: 1741252
数据集大小
- dataset_size: 324134869



