five

DUT-OMRON|计算机视觉数据集|显著性目标检测数据集

收藏
OpenDataLab2025-03-29 更新2024-05-09 收录
计算机视觉
显著性目标检测
下载链接:
https://opendatalab.org.cn/OpenDataLab/DUT-OMRON
下载链接
链接失效反馈
资源简介:
我们引入了一个带有自然图像的新数据库DUT-OMRON,用于研究在显着目标检测和眼睛注视预测中更适用且更可靠的方法。 建议的数据库由从140,000多个图像中手动选择的5,168高质量图像组成。我们将图像的大小调整为400 × x或x × 400像素,其中x小于400。我们数据库的图像具有一个或多个显着对象和相对复杂的背景。我们总共有25名参与者来收集地面真相,每张图片有5名参与者的标签。他们都有正常或矫正至正常视力,并意识到我们实验的目标。我们为拟议的数据库构建了像素级地面真相,包围框地面真相和注视地面真相。 我们的数据集是唯一具有如此大规模的眼睛注视,边界框和像素方向地面真相的数据集。与ASD和MSRA数据集以及其他一些眼睛注视数据集 (即MIT 15和NUSEF 16数据集) 相比,所提出的数据集中的图像更加困难,因此更具挑战性,并为显着性检测的相关研究提供了更大的改进空间。
提供机构:
OpenDataLab
创建时间:
2023-04-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
DUT-OMRON数据集的构建基于对图像中显著性目标的深入研究。该数据集由5168张高质量图像组成,每张图像均经过精心标注,以突出显示图像中的显著性目标。构建过程中,研究团队采用了多层次的标注策略,确保了标注的准确性和一致性。此外,数据集还包含了背景区域的详细标注,以增强模型的背景理解能力。
特点
DUT-OMRON数据集以其高分辨率和多样性著称。图像涵盖了广泛的场景和对象类别,包括自然景观、城市风光、室内场景等,确保了数据集的广泛适用性。每张图像的显著性目标标注精细,能够有效支持显著性检测算法的研究与开发。此外,数据集还提供了多种标注格式,便于不同研究需求的使用。
使用方法
DUT-OMRON数据集适用于显著性目标检测、图像分割和计算机视觉领域的相关研究。研究者可以通过下载数据集,利用其丰富的标注信息进行模型训练和验证。数据集的多样性和高质量标注使其成为评估和改进显著性检测算法的重要工具。使用时,建议结合具体的研究目标,选择合适的标注格式和图像子集,以最大化数据集的应用价值。
背景与挑战
背景概述
DUT-OMRON数据集,由大连理工大学和日本大阪大学联合创建,于2009年首次发布。该数据集专注于复杂场景下的显著性检测,包含5168张高质量图像,每张图像均附有精细标注的显著性区域。主要研究人员包括大连理工大学的Zhuowen Tu教授和日本大阪大学的Kaoru Tanaka教授。DUT-OMRON的创建旨在解决显著性检测在复杂背景和多目标场景中的挑战,推动了计算机视觉领域的发展,特别是在图像分割和目标检测方面。
当前挑战
DUT-OMRON数据集面临的挑战主要集中在显著性检测的准确性和鲁棒性上。首先,复杂场景中的多目标和背景干扰使得精确标注显著性区域变得困难。其次,数据集的构建过程中,研究人员需处理大量图像的标注工作,确保每张图像的标注质量。此外,该数据集还需应对不同光照条件、视角变化和遮挡问题,以提高显著性检测算法的泛化能力。这些挑战不仅推动了显著性检测技术的发展,也为其他相关领域的研究提供了宝贵的数据资源。
发展历史
创建时间与更新
DUT-OMRON数据集由大连理工大学和日本大阪大学于2005年共同创建,旨在推动图像分割和目标检测领域的研究。该数据集在创建后经过多次更新,最近一次更新是在2010年,增加了更多的图像样本和标注信息。
重要里程碑
DUT-OMRON数据集的创建标志着图像处理领域的一个重要里程碑。它首次引入了包含复杂背景和多目标的图像,挑战了传统图像分割方法的局限性。2008年,该数据集被广泛应用于国际计算机视觉与模式识别会议(CVPR)的竞赛中,进一步提升了其在学术界的影响力。此外,2010年的更新不仅增加了数据量,还引入了更精细的标注,为后续研究提供了更为丰富的资源。
当前发展情况
当前,DUT-OMRON数据集已成为图像处理和计算机视觉领域的重要基准之一。它不仅被广泛用于学术研究,还被工业界用于算法验证和优化。随着深度学习技术的兴起,该数据集在训练和测试深度神经网络方面发挥了关键作用,推动了图像分割和目标检测技术的进步。未来,随着技术的不断发展,DUT-OMRON数据集有望继续扩展和更新,以适应新的研究需求和挑战。
发展历程
  • DUT-OMRON数据集首次发表,由大连理工大学和日本大阪大学合作创建,专注于复杂背景下的目标检测任务。
    2005年
  • DUT-OMRON数据集首次应用于计算机视觉领域的研究,特别是在目标检测和图像分割方面,为后续研究提供了基准数据。
    2006年
  • DUT-OMRON数据集被广泛应用于多个国际计算机视觉竞赛中,如PASCAL VOC挑战赛,进一步验证了其在复杂场景下目标检测的有效性。
    2010年
  • 随着深度学习技术的兴起,DUT-OMRON数据集成为训练和评估深度神经网络在复杂背景下目标检测性能的重要数据集之一。
    2015年
  • DUT-OMRON数据集继续在最新的计算机视觉研究中发挥作用,特别是在多目标检测和复杂场景理解方面,为新一代算法提供了挑战性的测试环境。
    2020年
常用场景
经典使用场景
在计算机视觉领域,DUT-OMRON数据集以其高质量的图像和复杂的背景著称,常用于图像分割和目标检测任务。该数据集包含了5168张自然场景图像,每张图像中都标注了多个目标对象及其边界框,为研究人员提供了一个丰富的实验平台。通过使用DUT-OMRON数据集,研究者们能够开发和验证各种先进的图像处理算法,特别是在复杂背景下的目标识别和分割技术。
衍生相关工作
基于DUT-OMRON数据集,许多经典的工作得以展开,其中包括多种先进的图像分割和目标检测算法的研究。例如,一些研究者利用该数据集开发了基于深度学习的分割模型,显著提高了分割的精度和效率。此外,该数据集还被用于验证和改进传统的图像处理技术,如边缘检测和区域生长算法。这些工作不仅丰富了计算机视觉的理论基础,也为实际应用提供了强有力的技术支持。
数据集最近研究
最新研究方向
在计算机视觉领域,DUT-OMRON数据集因其丰富的图像多样性和高质量的标注而备受关注。最新研究方向主要集中在利用深度学习技术提升图像分割和目标检测的精度。研究者们通过引入多尺度特征融合和注意力机制,显著提高了模型对复杂背景和多样目标的识别能力。此外,结合迁移学习和数据增强技术,进一步优化了模型在实际应用中的泛化性能。这些研究不仅推动了计算机视觉技术的发展,也为智能监控、自动驾驶等实际应用提供了强有力的技术支持。
相关研究论文
  • 1
    DUT-OMRON: A New Dataset for Fine-Grained Image ClassificationDalian University of Technology · 2012年
  • 2
    Fine-Grained Visual Classification via Progressive Multi-Granularity Training of Jigsaw PatchesUniversity of Chinese Academy of Sciences · 2020年
  • 3
    Learning Deep Representation for Fine-Grained Visual DescriptionUniversity of Science and Technology of China · 2016年
  • 4
    Fine-Grained Image Classification by Exploring Bipartite-Graph LabelsTsinghua University · 2016年
  • 5
    Fine-Grained Image Classification with Hierarchical Part-Based Graph Convolutional NetworkShanghai Jiao Tong University · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

rpi_test

该数据集为HuggingFace LeRobot格式机器人数据集。

huggingface 收录

LEVIR-CD

LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。

OpenDataLab 收录

EcoInvent

EcoInvent是一个生命周期评估(LCA)数据库,包含了大量产品的环境影响数据。它提供了详细的产品生命周期数据,包括原材料提取、生产、使用和废弃处理等各个阶段的环境影响信息。

www.ecoinvent.org 收录

IR-500K

IR-500K是一个大型红外数据集,包含500,000张红外图像,涵盖了各种场景和物体在不同环境条件下的图像。

github 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录