jp1924/KoCC3M
收藏Hugging Face2024-06-11 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/jp1924/KoCC3M
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int32
- name: image
dtype: image
- name: caption
dtype: string
- name: caption_ls
list: string
- name: category
dtype: string
- name: en_caption
dtype: string
splits:
- name: train
num_bytes: 204050100807.75
num_examples: 2281386
- name: validation
num_bytes: 1029547639.625
num_examples: 11155
download_size: 204206545714
dataset_size: 205079648447.375
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
original_data from [QuoQA-NLP/KoCC3M](https://huggingface.co/datasets/QuoQA-NLP/KoCC3M)
원본 데이터가 URL로 구성되어 있어서
시간이 지날수록 디지텉 풍화가 심해짐. 보존차원에서 이미지를 다운받아 datasets로 만듬
提供机构:
jp1924
原始信息汇总
数据集信息
特征
- id: 数据类型为
int32 - image: 数据类型为
image - caption: 数据类型为
string - caption_ls: 数据类型为
list的string - category: 数据类型为
string - en_caption: 数据类型为
string
数据分割
- train:
- 字节数: 204050100807.75
- 样本数: 2281386
- validation:
- 字节数: 1029547639.625
- 样本数: 11155
数据大小
- 下载大小: 204206545714
- 数据集大小: 205079648447.375
配置
- default:
- 训练数据文件路径:
data/train-* - 验证数据文件路径:
data/validation-*
- 训练数据文件路径:



