five

RIW/small_coco_test_10_1

收藏
Hugging Face2024-04-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/RIW/small_coco_test_10_1
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: caption dtype: string - name: url dtype: string - name: key dtype: string - name: status dtype: string - name: error_message dtype: 'null' - name: width dtype: int64 - name: height dtype: int64 - name: original_width dtype: int64 - name: original_height dtype: int64 - name: exif dtype: string - name: sha256 dtype: string - name: watermark dtype: bool splits: - name: train num_bytes: 807190652.44 num_examples: 9840 - name: validation num_bytes: 885003521.915 num_examples: 8965 download_size: 366742283 dataset_size: 1692194174.355 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* ---

数据集信息: 特征字段: - 特征名称:image(图像),数据类型为图像类型 - 特征名称:caption(说明文本),数据类型为字符串 - 特征名称:url(资源链接),数据类型为字符串 - 特征名称:key(唯一标识键),数据类型为字符串 - 特征名称:status(处理状态),数据类型为字符串 - 特征名称:error_message(错误信息),数据类型为null(空值) - 特征名称:width(图像宽度),数据类型为64位整型(int64) - 特征名称:height(图像高度),数据类型为64位整型(int64) - 特征名称:original_width(原始图像宽度),数据类型为64位整型(int64) - 特征名称:original_height(原始图像高度),数据类型为64位整型(int64) - 特征名称:exif(可交换图像文件元数据),数据类型为字符串 - 特征名称:sha256(SHA256哈希值),数据类型为字符串 - 特征名称:watermark(水印标记),数据类型为布尔类型(bool) 数据子集: - 子集名称:train(训练集),占用字节数为807190652.44,包含9840个样本 - 子集名称:validation(验证集),占用字节数为885003521.915,包含8965个样本 整体下载总大小:366742283 数据集总存储大小:1692194174.355 数据集配置: - 配置名称:default(默认配置),对应数据文件路径如下: - 训练集(train):data/train-* - 验证集(validation):data/validation-*
提供机构:
RIW
原始信息汇总

数据集概述

数据集特征

  • image: 图像数据类型
  • caption: 字符串数据类型
  • url: 字符串数据类型
  • key: 字符串数据类型
  • status: 字符串数据类型
  • error_message: 空值数据类型
  • width: 整数数据类型
  • height: 整数数据类型
  • original_width: 整数数据类型
  • original_height: 整数数据类型
  • exif: 字符串数据类型
  • sha256: 字符串数据类型
  • watermark: 布尔数据类型

数据集分割

  • train:
    • 示例数量: 9840
    • 数据大小: 807190652.44 字节
  • validation:
    • 示例数量: 8965
    • 数据大小: 885003521.915 字节

数据集大小

  • 下载大小: 366742283 字节
  • 数据集总大小: 1692194174.355 字节

配置文件

  • config_name: default
  • data_files:
    • train: data/train-*
    • validation: data/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作