five

ryanramos/biased_captioning_toy_data

收藏
Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ryanramos/biased_captioning_toy_data
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: color_only_discrete_2_classes_0.5 features: - name: image dtype: image - name: index dtype: int64 - name: digit dtype: int64 - name: digit_color_ix dtype: int64 - name: caption dtype: string splits: - name: train num_bytes: 12886049.66 num_examples: 9870 - name: val num_bytes: 2576074.392 num_examples: 1976 - name: test num_bytes: 2554058.6 num_examples: 1960 download_size: 11011458 dataset_size: 18016182.652000003 - config_name: color_only_discrete_2_classes_0.6 features: - name: image dtype: image - name: index dtype: int64 - name: digit dtype: int64 - name: digit_color_ix dtype: int64 - name: caption dtype: string splits: - name: train num_bytes: 12884271.66 num_examples: 9870 - name: val num_bytes: 2577352.392 num_examples: 1976 download_size: 9444931 dataset_size: 15461624.052000001 - config_name: color_only_discrete_2_classes_0.7 features: - name: image dtype: image - name: index dtype: int64 - name: digit dtype: int64 - name: digit_color_ix dtype: int64 - name: caption dtype: string splits: - name: train num_bytes: 12877646.66 num_examples: 9870 - name: val num_bytes: 2577362.392 num_examples: 1976 download_size: 9436414 dataset_size: 15455009.052000001 - config_name: color_only_discrete_2_classes_0.8 features: - name: image dtype: image - name: index dtype: int64 - name: digit dtype: int64 - name: digit_color_ix dtype: int64 - name: caption dtype: string splits: - name: train num_bytes: 12874281.66 num_examples: 9870 - name: val num_bytes: 2573004.392 num_examples: 1976 download_size: 9410619 dataset_size: 15447286.052000001 - config_name: color_only_discrete_2_classes_0.9 features: - name: image dtype: image - name: index dtype: int64 - name: digit dtype: int64 - name: digit_color_ix dtype: int64 - name: caption dtype: string splits: - name: train num_bytes: 12862836.66 num_examples: 9870 - name: val num_bytes: 2573688.392 num_examples: 1976 download_size: 9393830 dataset_size: 15436525.052000001 configs: - config_name: color_only_discrete_2_classes_0.5 data_files: - split: train path: color_only_discrete_2_classes_0.5/train-* - split: val path: color_only_discrete_2_classes_0.5/val-* - split: test path: color_only_discrete_2_classes_0.5/test-* - config_name: color_only_discrete_2_classes_0.6 data_files: - split: train path: color_only_discrete_2_classes_0.6/train-* - split: val path: color_only_discrete_2_classes_0.6/val-* - config_name: color_only_discrete_2_classes_0.7 data_files: - split: train path: color_only_discrete_2_classes_0.7/train-* - split: val path: color_only_discrete_2_classes_0.7/val-* - config_name: color_only_discrete_2_classes_0.8 data_files: - split: train path: color_only_discrete_2_classes_0.8/train-* - split: val path: color_only_discrete_2_classes_0.8/val-* - config_name: color_only_discrete_2_classes_0.9 data_files: - split: train path: color_only_discrete_2_classes_0.9/train-* - split: val path: color_only_discrete_2_classes_0.9/val-* ---
提供机构:
ryanramos
原始信息汇总

数据集概述

数据集配置

配置 color_only_discrete_2_classes_0.5

  • 特征:
    • image: 图像类型
    • index: 整数类型
    • digit: 整数类型
    • digit_color_ix: 整数类型
    • caption: 字符串类型
  • 分割:
    • train: 12886049.66 字节, 9870 个样本
    • val: 2576074.392 字节, 1976 个样本
    • test: 2554058.6 字节, 1960 个样本
  • 下载大小: 11011458 字节
  • 数据集大小: 18016182.652000003 字节

配置 color_only_discrete_2_classes_0.6

  • 特征:
    • image: 图像类型
    • index: 整数类型
    • digit: 整数类型
    • digit_color_ix: 整数类型
    • caption: 字符串类型
  • 分割:
    • train: 12884271.66 字节, 9870 个样本
    • val: 2577352.392 字节, 1976 个样本
  • 下载大小: 9444931 字节
  • 数据集大小: 15461624.052000001 字节

配置 color_only_discrete_2_classes_0.7

  • 特征:
    • image: 图像类型
    • index: 整数类型
    • digit: 整数类型
    • digit_color_ix: 整数类型
    • caption: 字符串类型
  • 分割:
    • train: 12877646.66 字节, 9870 个样本
    • val: 2577362.392 字节, 1976 个样本
  • 下载大小: 9436414 字节
  • 数据集大小: 15455009.052000001 字节

配置 color_only_discrete_2_classes_0.8

  • 特征:
    • image: 图像类型
    • index: 整数类型
    • digit: 整数类型
    • digit_color_ix: 整数类型
    • caption: 字符串类型
  • 分割:
    • train: 12874281.66 字节, 9870 个样本
    • val: 2573004.392 字节, 1976 个样本
  • 下载大小: 9410619 字节
  • 数据集大小: 15447286.052000001 字节

配置 color_only_discrete_2_classes_0.9

  • 特征:
    • image: 图像类型
    • index: 整数类型
    • digit: 整数类型
    • digit_color_ix: 整数类型
    • caption: 字符串类型
  • 分割:
    • train: 12862836.66 字节, 9870 个样本
    • val: 2573688.392 字节, 1976 个样本
  • 下载大小: 9393830 字节
  • 数据集大小: 15436525.052000001 字节

数据文件路径

配置 color_only_discrete_2_classes_0.5

  • 训练集: color_only_discrete_2_classes_0.5/train-*
  • 验证集: color_only_discrete_2_classes_0.5/val-*
  • 测试集: color_only_discrete_2_classes_0.5/test-*

配置 color_only_discrete_2_classes_0.6

  • 训练集: color_only_discrete_2_classes_0.6/train-*
  • 验证集: color_only_discrete_2_classes_0.6/val-*

配置 color_only_discrete_2_classes_0.7

  • 训练集: color_only_discrete_2_classes_0.7/train-*
  • 验证集: color_only_discrete_2_classes_0.7/val-*

配置 color_only_discrete_2_classes_0.8

  • 训练集: color_only_discrete_2_classes_0.8/train-*
  • 验证集: color_only_discrete_2_classes_0.8/val-*

配置 color_only_discrete_2_classes_0.9

  • 训练集: color_only_discrete_2_classes_0.9/train-*
  • 验证集: color_only_discrete_2_classes_0.9/val-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作