RIW/small-coco-wm_1_120k
收藏Hugging Face2024-01-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RIW/small-coco-wm_1_120k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: caption
dtype: string
- name: url
dtype: string
- name: key
dtype: string
- name: status
dtype: string
- name: error_message
dtype: 'null'
- name: width
dtype: int64
- name: height
dtype: int64
- name: original_width
dtype: int64
- name: original_height
dtype: int64
- name: exif
dtype: string
- name: sha256
dtype: string
splits:
- name: train
num_bytes: 9828211996.624
num_examples: 119846
- name: validation
num_bytes: 802545519.0
num_examples: 10000
download_size: 2282688132
dataset_size: 10630757515.624
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
数据集信息:
特征列表:
- 特征名:图像(image),数据类型:图像
- 特征名:标题(caption),数据类型:字符串
- 特征名:资源链接(url),数据类型:字符串
- 特征名:唯一键(key),数据类型:字符串
- 特征名:状态(status),数据类型:字符串
- 特征名:错误信息(error_message),数据类型:空值(null)
- 特征名:宽度(width),数据类型:64位整型
- 特征名:高度(height),数据类型:64位整型
- 特征名:原始宽度(original_width),数据类型:64位整型
- 特征名:原始高度(original_height),数据类型:64位整型
- 特征名:可交换图像文件格式信息(EXIF),数据类型:字符串
- 特征名:SHA256哈希值(sha256),数据类型:字符串
数据集拆分:
- 拆分名:训练集(train),占用字节数:9828211996.624,样本数量:119846
- 拆分名:验证集(validation),占用字节数:802545519.0,样本数量:10000
下载总大小:2282688132 字节
数据集总占用大小:10630757515.624 字节
数据集配置:
- 配置名称:默认配置(default),数据文件:
- 训练集拆分:路径为 data/train-*
- 验证集拆分:路径为 data/validation-*
提供机构:
RIW
原始信息汇总
数据集概述
数据集特征
- image: 图像数据
- caption: 字符串,描述信息
- url: 字符串,图像的URL
- key: 字符串,唯一标识符
- status: 字符串,状态信息
- error_message: 空值,错误信息
- width: 整数,图像宽度
- height: 整数,图像高度
- original_width: 整数,原始图像宽度
- original_height: 整数,原始图像高度
- exif: 字符串,EXIF信息
- sha256: 字符串,SHA256哈希值
数据集分割
- train: 训练集,包含119846个样本,大小为9828211996.624字节
- validation: 验证集,包含10000个样本,大小为802545519.0字节
数据集大小
- 下载大小: 2282688132字节
- 数据集总大小: 10630757515.624字节
配置
- default: 默认配置
- train: 路径为
data/train-* - validation: 路径为
data/validation-*
- train: 路径为



