five

arielnlee/Realistic-Occlusion-Dataset

收藏
Hugging Face2023-07-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arielnlee/Realistic-Occlusion-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
真实遮挡数据集(ROD)是通过精心设计的对象收集协议创建的,旨在收集和捕捉来自16个类别的40多个不同对象的图像:香蕉、棒球、牛仔帽、杯子、哑铃、锤子、笔记本电脑、微波炉、鼠标、橙子、枕头、盘子、螺丝刀、煎锅、铲子和花瓶。图像在明亮的房间内使用iPhone 13 Pro超广角摄像头拍摄,背景为棕色木桌和纯色墙壁。遮挡物为红色或蓝色的木块或纸板,位置在相机与主物体之间,沿x轴从左到右变化。每个对象包括1张清晰图像和12张遮挡图像,总计1231个样本。该数据集用于测试模型在遮挡情况下的鲁棒性,特别是在论文《Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing》中。

Real-world Occlusion Dataset (ROD) was created through a meticulously designed object collection protocol, aiming to collect and capture images of over 40 distinct objects across 16 categories: banana, baseball, cowboy hat, cup, dumbbell, hammer, laptop, microwave oven, mouse, orange, pillow, plate, screwdriver, frying pan, shovel, and vase. The images were captured in a bright room using the ultra-wide-angle camera of an iPhone 13 Pro, with a brown wooden table and solid-color walls as the background. The occluders are red or blue wooden blocks or cardboard pieces, positioned between the camera and the main object and varying from left to right along the x-axis. Each object includes 1 clear image and 12 occlusion images, totaling 1231 samples. This dataset is used to test the robustness of models under occlusion conditions, and was specifically applied in the paper titled "Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing".
提供机构:
arielnlee
原始信息汇总

Real Occlusion Dataset (ROD) 数据集概述

数据集基本信息

  • 许可证: other
  • 任务类别: image-classification
  • 语言: en
  • 标签: occlusion
  • 大小类别: 1K<n<10K

数据集特征

  • 图像 (image): 数据类型为图像。
  • 标签 (label): 数据类型为类别标签,包含以下类别名称:
    • 0: banana
    • 1: baseball
    • 2: cowboy hat
    • 3: cup
    • 4: dumbbell
    • 5: hammer
    • 6: laptop
    • 7: microwave
    • 8: mouse
    • 9: orange
    • 10: pillow
    • 11: plate
    • 12: screwdriver
    • 13: skillet
    • 14: spatula
    • 15: vase

数据集分割

  • 名称: ROD
  • 字节数: 3306212413
  • 示例数量: 1231
  • 下载大小: 3285137456
  • 数据集大小: 3306212413

数据集描述

  • 对象收集: 包含16个类别,超过40个不同对象。
  • 拍摄环境: 在明亮的房间内,使用自然柔和光线,所有对象放置在棕色木桌上,背景为单色墙。
  • 拍摄设备: iPhone 13 Pro 超广角相机,使用三脚架,拍摄角度约90度,距离对象1米。
  • 遮挡物: 木块或纸板,涂成红色或蓝色,放置在相机与主对象之间,x轴位置变化,从画面左侧移动至右侧。
  • 图像数量: 每个对象拍摄1张清晰图像和12张遮挡图像。
搜集汇总
数据集介绍
main_image_url
构建方式
在深度学习模型对遮挡处理能力的评估领域,Realistic Occlusion Dataset(ROD)的构建采用了精心的物体收集协议。该数据集通过在明亮的室内环境下,使用iPhone 13 Pro ultra-wide相机固定在三脚架上,从约90度的俯角和1米的距离,对16个类别的40+不同物体进行拍摄。每个物体在无遮挡和12种不同遮挡位置下各拍摄一次,遮挡物为红色或蓝色的木块或纸板,其位置沿x轴变化,从而形成了一个既包含清晰图像也包含遮挡图像的数据集。
特点
ROD数据集的显著特点在于其现实性,所有图像均在自然光线下捕捉,且物体均放置在棕色木桌上,背景为单一色墙。这种设置旨在模拟真实生活中的物体摆放与光照条件。此外,数据集的遮挡设计考虑了遮挡物的位置变化,从而为模型提供了丰富的遮挡情景,用以测试和提升其鲁棒性。数据集规模适中,包含1231个样本,涵盖了从香蕉到花瓶等日常物品。
使用方法
使用ROD数据集时,研究者可依据其提供的图像和标签进行模型训练、验证和测试。数据集以 splits 的形式组织,便于按需加载和操作。由于数据集包含了清晰的物体图像及其被不同方式遮挡的变体,研究者可专注于评估模型对遮挡的敏感性和鲁棒性。遵循相应的使用协议和许可,ROD数据集为计算机视觉领域中的遮挡处理研究提供了宝贵的资源。
背景与挑战
背景概述
在深度学习模型评估领域,确保模型在面对实际场景中的遮挡情况时仍能保持鲁棒性,是一个重要的研究方向。Realistic Occlusion Dataset(ROD)数据集应运而生,旨在为研究者提供一种新的测试方法,以评估模型在物体遮挡情形下的识别性能。该数据集由Ariel N. Lee等研究人员于2023年创建,包含16个类别的40+不同物体,通过精确的物体收集协议,捕捉了每个物体在自然光线下被遮挡和不被遮挡的图像。该数据集的创建,为视觉识别领域提供了一种新的评估标准,对模型鲁棒性研究具有显著影响。
当前挑战
ROD数据集在构建过程中面临的挑战主要包括:如何精确控制遮挡物的位置和大小,以确保数据集的有效性和一致性;如何在保持图像真实性的同时,避免过度人工干预。此外,数据集在解决物体识别领域中的遮挡问题时,也面临如何设计能够适应不同遮挡程度和类型的模型评估方法的挑战。
常用场景
经典使用场景
在图像识别领域,arielnlee/Realistic-Occlusion-Dataset数据集提供了一个独特的视角,其通过真实场景中的遮挡情况来测试模型的鲁棒性。该数据集包含16个类别的物体,每种物体都有12张被不同方式遮挡的图片以及一张清晰图片,这对于研究模型在部分信息遮挡下的表现尤为关键。
实际应用
在实际应用中,该数据集可被用于改进自动驾驶系统中的物体识别模块,使其在复杂交通环境中能更好地处理被遮挡的物体,从而提高行驶安全。此外,它也适用于智能家居系统,以提高对环境中被遮挡物品的识别精度。
衍生相关工作
基于此数据集,已有研究如Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing等,探索了如何将遮挡处理能力硬编码进卷积神经网络,这些研究为深度学习模型在遮挡环境下的表现提供了新的视角和方法论。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作