five

llizhx/sampled_coco2014_val_100

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/llizhx/sampled_coco2014_val_100
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: question_id dtype: string - name: image dtype: image - name: question dtype: string - name: answer sequence: string - name: id dtype: int64 - name: license dtype: int8 - name: file_name dtype: string - name: coco_url dtype: string - name: height dtype: int32 - name: width dtype: int32 - name: date_captured dtype: string - name: instance sequence: string splits: - name: painting_style num_bytes: 19190580.0 num_examples: 100 - name: val num_bytes: 17061873.0 num_examples: 100 - name: sketch_style num_bytes: 13182473.0 num_examples: 100 - name: gblur_sub_level4 num_bytes: 2991085.0 num_examples: 100 - name: gblur_sub_level3 num_bytes: 3193479.0 num_examples: 100 - name: gblur_sub_level2 num_bytes: 3409373.0 num_examples: 100 - name: gblur_sub_level5 num_bytes: 2838830.0 num_examples: 100 - name: gblur_sub_level9 num_bytes: 2149838.0 num_examples: 100 - name: gblur_sub_level7 num_bytes: 2401227.0 num_examples: 100 - name: gblur_sub_level6 num_bytes: 2586463.0 num_examples: 100 - name: gblur_sub_level1 num_bytes: 3721808.0 num_examples: 100 - name: gblur_sub_level8 num_bytes: 2261608.0 num_examples: 100 - name: bright_sub_level4 num_bytes: 5083496.0 num_examples: 100 - name: bright_sub_level3 num_bytes: 5124079.0 num_examples: 100 - name: bright_sub_level2 num_bytes: 5138971.0 num_examples: 100 - name: bright_sub_level5 num_bytes: 5046399.0 num_examples: 100 - name: bright_sub_level9 num_bytes: 4815354.0 num_examples: 100 - name: bright_sub_level7 num_bytes: 4947848.0 num_examples: 100 - name: bright_sub_level6 num_bytes: 5005548.0 num_examples: 100 - name: bright_sub_level1 num_bytes: 5151977.0 num_examples: 100 - name: bright_sub_level8 num_bytes: 4890512.0 num_examples: 100 - name: dither_sub_level4 num_bytes: 5779305.0 num_examples: 100 - name: dither_sub_level3 num_bytes: 5721142.0 num_examples: 100 - name: dither_sub_level2 num_bytes: 5627907.0 num_examples: 100 download_size: 155742860 dataset_size: 137321175.0 configs: - config_name: default data_files: - split: val path: data/val-* - split: painting_style path: data/painting_style-* - split: sketch_style path: data/sketch_style-* - split: gblur_sub_level4 path: data/gblur_sub_level4-* - split: gblur_sub_level3 path: data/gblur_sub_level3-* - split: gblur_sub_level2 path: data/gblur_sub_level2-* - split: gblur_sub_level5 path: data/gblur_sub_level5-* - split: gblur_sub_level9 path: data/gblur_sub_level9-* - split: gblur_sub_level7 path: data/gblur_sub_level7-* - split: gblur_sub_level6 path: data/gblur_sub_level6-* - split: gblur_sub_level1 path: data/gblur_sub_level1-* - split: gblur_sub_level8 path: data/gblur_sub_level8-* - split: bright_sub_level4 path: data/bright_sub_level4-* - split: bright_sub_level3 path: data/bright_sub_level3-* - split: bright_sub_level2 path: data/bright_sub_level2-* - split: bright_sub_level5 path: data/bright_sub_level5-* - split: bright_sub_level9 path: data/bright_sub_level9-* - split: bright_sub_level7 path: data/bright_sub_level7-* - split: bright_sub_level6 path: data/bright_sub_level6-* - split: bright_sub_level1 path: data/bright_sub_level1-* - split: bright_sub_level8 path: data/bright_sub_level8-* - split: dither_sub_level4 path: data/dither_sub_level4-* - split: dither_sub_level3 path: data/dither_sub_level3-* - split: dither_sub_level2 path: data/dither_sub_level2-* ---

数据集信息: 特征字段: - 字段名:问题编号(question_id),数据类型:字符串 - 字段名:图像(image),数据类型:图像 - 字段名:问题文本(question),数据类型:字符串 - 字段名:答案(answer),数据类型:字符串序列 - 字段名:样本编号(id),数据类型:64位整型 - 字段名:许可证标识(license),数据类型:8位整型 - 字段名:文件名(file_name),数据类型:字符串 - 字段名:coco_url,数据类型:字符串 - 字段名:图像高度(height),数据类型:32位整型 - 字段名:图像宽度(width),数据类型:32位整型 - 字段名:拍摄日期(date_captured),数据类型:字符串 - 字段名:实例(instance),数据类型:字符串序列 数据集划分: - 划分名称:绘画风格(painting_style),占用字节数:19190580.0,样本数:100 - 划分名称:验证集(val),占用字节数:17061873.0,样本数:100 - 划分名称:素描风格(sketch_style),占用字节数:13182473.0,样本数:100 - 划分名称:高斯模糊子级别4(gblur_sub_level4),占用字节数:2991085.0,样本数:100 - 划分名称:高斯模糊子级别3(gblur_sub_level3),占用字节数:3193479.0,样本数:100 - 划分名称:高斯模糊子级别2(gblur_sub_level2),占用字节数:3409373.0,样本数:100 - 划分名称:高斯模糊子级别5(gblur_sub_level5),占用字节数:2838830.0,样本数:100 - 划分名称:高斯模糊子级别9(gblur_sub_level9),占用字节数:2149838.0,样本数:100 - 划分名称:高斯模糊子级别7(gblur_sub_level7),占用字节数:2401227.0,样本数:100 - 划分名称:高斯模糊子级别6(gblur_sub_level6),占用字节数:2586463.0,样本数:100 - 划分名称:高斯模糊子级别1(gblur_sub_level1),占用字节数:3721808.0,样本数:100 - 划分名称:高斯模糊子级别8(gblur_sub_level8),占用字节数:2261608.0,样本数:100 - 划分名称:亮度调整子级别4(bright_sub_level4),占用字节数:5083496.0,样本数:100 - 划分名称:亮度调整子级别3(bright_sub_level3),占用字节数:5124079.0,样本数:100 - 划分名称:亮度调整子级别2(bright_sub_level2),占用字节数:5138971.0,样本数:100 - 划分名称:亮度调整子级别5(bright_sub_level5),占用字节数:5046399.0,样本数:100 - 划分名称:亮度调整子级别9(bright_sub_level9),占用字节数:4815354.0,样本数:100 - 划分名称:亮度调整子级别7(bright_sub_level7),占用字节数:4947848.0,样本数:100 - 划分名称:亮度调整子级别6(bright_sub_level6),占用字节数:5005548.0,样本数:100 - 划分名称:亮度调整子级别1(bright_sub_level1),占用字节数:5151977.0,样本数:100 - 划分名称:亮度调整子级别8(bright_sub_level8),占用字节数:4890512.0,样本数:100 - 划分名称:抖动处理子级别4(dither_sub_level4),占用字节数:5779305.0,样本数:100 - 划分名称:抖动处理子级别3(dither_sub_level3),占用字节数:5721142.0,样本数:100 - 划分名称:抖动处理子级别2(dither_sub_level2),占用字节数:5627907.0,样本数:100 下载总大小:155742860 数据集总存储大小:137321175.0 数据集配置: - 配置名称:默认配置(default) 数据文件映射: - 划分:验证集(val),数据路径:data/val-* - 划分:绘画风格(painting_style),数据路径:data/painting_style-* - 划分:素描风格(sketch_style),数据路径:data/sketch_style-* - 划分:高斯模糊子级别4(gblur_sub_level4),数据路径:data/gblur_sub_level4-* - 划分:高斯模糊子级别3(gblur_sub_level3),数据路径:data/gblur_sub_level3-* - 划分:高斯模糊子级别2(gblur_sub_level2),数据路径:data/gblur_sub_level2-* - 划分:高斯模糊子级别5(gblur_sub_level5),数据路径:data/gblur_sub_level5-* - 划分:高斯模糊子级别9(gblur_sub_level9),数据路径:data/gblur_sub_level9-* - 划分:高斯模糊子级别7(gblur_sub_level7),数据路径:data/gblur_sub_level7-* - 划分:高斯模糊子级别6(gblur_sub_level6),数据路径:data/gblur_sub_level6-* - 划分:高斯模糊子级别1(gblur_sub_level1),数据路径:data/gblur_sub_level1-* - 划分:高斯模糊子级别8(gblur_sub_level8),数据路径:data/gblur_sub_level8-* - 划分:亮度调整子级别4(bright_sub_level4),数据路径:data/bright_sub_level4-* - 划分:亮度调整子级别3(bright_sub_level3),数据路径:data/bright_sub_level3-* - 划分:亮度调整子级别2(bright_sub_level2),数据路径:data/bright_sub_level2-* - 划分:亮度调整子级别5(bright_sub_level5),数据路径:data/bright_sub_level5-* - 划分:亮度调整子级别9(bright_sub_level9),数据路径:data/bright_sub_level9-* - 划分:亮度调整子级别7(bright_sub_level7),数据路径:data/bright_sub_level7-* - 划分:亮度调整子级别6(bright_sub_level6),数据路径:data/bright_sub_level6-* - 划分:亮度调整子级别1(bright_sub_level1),数据路径:data/bright_sub_level1-* - 划分:亮度调整子级别8(bright_sub_level8),数据路径:data/bright_sub_level8-* - 划分:抖动处理子级别4(dither_sub_level4),数据路径:data/dither_sub_level4-* - 划分:抖动处理子级别3(dither_sub_level3),数据路径:data/dither_sub_level3-* - 划分:抖动处理子级别2(dither_sub_level2),数据路径:data/dither_sub_level2-*
提供机构:
llizhx
原始信息汇总

数据集概述

数据集特征

  • question_id: 数据类型为字符串。
  • image: 数据类型为图像。
  • question: 数据类型为字符串。
  • answer: 数据类型为字符串序列。
  • id: 数据类型为int64。
  • license: 数据类型为int8。
  • file_name: 数据类型为字符串。
  • coco_url: 数据类型为字符串。
  • height: 数据类型为int32。
  • width: 数据类型为int32。
  • date_captured: 数据类型为字符串。
  • instance: 数据类型为字符串序列。

数据集分割

  • painting_style: 100个样本,大小为19190580字节。
  • val: 100个样本,大小为17061873字节。
  • sketch_style: 100个样本,大小为13182473字节。
  • gblur_sub_level4: 100个样本,大小为2991085字节。
  • gblur_sub_level3: 100个样本,大小为3193479字节。
  • gblur_sub_level2: 100个样本,大小为3409373字节。
  • gblur_sub_level5: 100个样本,大小为2838830字节。
  • gblur_sub_level9: 100个样本,大小为2149838字节。
  • gblur_sub_level7: 100个样本,大小为2401227字节。
  • gblur_sub_level6: 100个样本,大小为2586463字节。
  • gblur_sub_level1: 100个样本,大小为3721808字节。
  • gblur_sub_level8: 100个样本,大小为2261608字节。
  • bright_sub_level4: 100个样本,大小为5083496字节。
  • bright_sub_level3: 100个样本,大小为5124079字节。
  • bright_sub_level2: 100个样本,大小为5138971字节。
  • bright_sub_level5: 100个样本,大小为5046399字节。
  • bright_sub_level9: 100个样本,大小为4815354字节。
  • bright_sub_level7: 100个样本,大小为4947848字节。
  • bright_sub_level6: 100个样本,大小为5005548字节。
  • bright_sub_level1: 100个样本,大小为5151977字节。
  • bright_sub_level8: 100个样本,大小为4890512字节。
  • dither_sub_level4: 100个样本,大小为5779305字节。
  • dither_sub_level3: 100个样本,大小为5721142字节。
  • dither_sub_level2: 100个样本,大小为5627907字节。

数据集大小

  • 下载大小: 155742860字节。
  • 数据集大小: 137321175字节。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于COCO 2014验证集构建,从中精选了100个样本,并进行了多种图像处理风格的变换。具体而言,数据集包括了原始图像、绘画风格、素描风格以及不同级别的模糊和亮度调整图像。每种风格和处理级别均包含100个样本,确保了数据集的多样性和均衡性。
特点
此数据集的显著特点在于其多样化的图像风格和处理效果,涵盖了从原始图像到多种艺术风格和图像增强技术的广泛范围。此外,数据集中的每个样本均附有详细的元数据,包括图像的尺寸、捕获日期、以及相关的COCO URL等信息,为研究者提供了丰富的上下文信息。
使用方法
研究者可以通过加载数据集中的不同配置文件来访问特定风格的图像数据。例如,使用'painting_style'配置可以获取绘画风格的图像,而'gblur_sub_level4'配置则提供第四级别的模糊处理图像。数据集支持多种编程语言和框架,如Python和HuggingFace的datasets库,便于快速集成和分析。
背景与挑战
背景概述
在计算机视觉领域,图像与文本的联合处理一直是研究的热点。llizhx/sampled_coco2014_val_100数据集由llizhx创建,旨在为图像问答(Image Question Answering, VQA)任务提供一个高质量的基准。该数据集基于COCO 2014验证集,精选了100个样本,涵盖了多种图像风格和处理方式,如绘画风格、素描风格以及不同程度的模糊和亮度调整。通过这些多样化的图像和相应的问答对,研究人员可以更全面地评估和提升图像问答系统的性能。
当前挑战
尽管llizhx/sampled_coco2014_val_100数据集为图像问答研究提供了丰富的资源,但其构建过程中仍面临诸多挑战。首先,数据集的多样性要求在图像处理和风格转换方面具备高精度的技术,以确保每种风格和处理方式都能真实反映原始图像的特征。其次,问答对的生成需要确保问题与图像内容的高度相关性,这要求对图像内容有深入的理解和准确的标注。此外,数据集的规模虽小,但多样性极高,如何在有限的样本中实现高效的模型训练和评估,也是研究人员需要克服的难题。
常用场景
经典使用场景
在计算机视觉领域,llizhx/sampled_coco2014_val_100数据集的经典使用场景主要集中在图像处理和视觉问答(VQA)任务中。该数据集包含了100张经过不同风格和处理方式的COCO2014验证集图像,每张图像附有相关的问题和答案。研究人员常利用此数据集来评估和优化图像处理算法,如图像风格转换、图像增强和图像去噪等。此外,该数据集还广泛应用于视觉问答系统的开发与测试,通过分析图像内容与问题答案之间的关系,提升模型的理解和推理能力。
解决学术问题
llizhx/sampled_coco2014_val_100数据集在学术研究中解决了多个关键问题。首先,它为图像处理算法提供了多样化的测试样本,帮助研究人员评估算法在不同图像风格和处理条件下的性能。其次,通过结合视觉问答任务,该数据集促进了图像理解与自然语言处理的交叉研究,推动了多模态学习的进展。此外,数据集中的图像与问题答案对也为开发更智能的视觉问答系统提供了宝贵的资源,有助于解决图像内容理解与语言表达之间的复杂映射问题。
衍生相关工作
基于llizhx/sampled_coco2014_val_100数据集,衍生了一系列经典工作。例如,研究人员利用该数据集开发了多种图像风格转换模型,如基于神经网络的风格迁移算法,显著提升了图像处理的灵活性和效果。同时,该数据集也促进了视觉问答领域的研究,诞生了多个基于深度学习的VQA模型,这些模型在图像理解和语言生成方面表现出色。此外,数据集的多风格图像还启发了图像增强和去噪算法的研究,推动了图像处理技术的进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作