five

UnderwaterDataset|水下视觉数据集|计算机视觉数据集

收藏
github2024-04-28 更新2024-05-31 收录
水下视觉
计算机视觉
下载链接:
https://github.com/ddz16/UnderwaterDataset
下载链接
链接失效反馈
资源简介:
该仓库包含多种水下数据集,用于增强、检测、分割等任务。每个数据集包含不同类型的数据,如图像、视频、配对数据、仅原始数据、深海数据、深度数据、合成数据和实例数据。

This repository encompasses a variety of underwater datasets designed for tasks such as enhancement, detection, and segmentation. Each dataset comprises different types of data, including images, videos, paired data, raw data exclusively, deep-sea data, depth data, synthetic data, and instance data.
创建时间:
2024-02-01
原始信息汇总

数据集概述

数据类型

  • Image: 包含多种图像数据集。
  • Video: 包含多种视频数据集。
  • Paired: 包含成对数据集,如原始图像与高质量参考图像。
  • RawOnly: 仅包含原始图像数据集。
  • DeepSea: 包含深海环境下的数据集。
  • Depth: 包含深度信息的数据集。
  • Synthetic: 包含合成数据集。
  • Instance: 包含实例级标注的数据集。

数据集详情

Enhancement/Restoration
  • SQUID (2019): 包含RAW图像、TIF文件、相机校准文件和距离图,共57个立体对。
  • U45 (2019): 包含45张受水下退化影响的照片。
  • Sea-thru (2019): 包含RAW图像和相应的深度图。
  • RUIE (2019): 包含两个子集,用于测试水下图像增强算法。
  • UIEB (2019): 包含890张原始水下图像及其高质量参考图像。
  • EUVP (2020): 包含超过12K对和8K未配对实例,用于训练CycleGAN。
  • OceanDark (2020): 包含183张在深海中使用人工照明捕获的图像。
  • LNRUD (2022): 包含50000张清洁图像和50000张相应的水下图像。
  • LSUI (2023): 包含4279对原始水下图像及其高质量参考图像。
  • UVE-38K (2023): 包含50个视频序列,超过38,000帧,用于水下视频增强。
  • DRUVA (2023): 包含20个视频,展示20种不同的浅水下物体。
  • NUID (2023): 包含925张不同非均匀光照条件下的真实水下图像。
  • SUVE (2024): 包含660对训练视频和180对测试视频,覆盖广泛的水下成像条件。
  • UVEB (2024): 包含1,308对视频序列,超过453,000帧,适应多样和复杂的水下环境。
Object Detection
  • FishCLEF-2015 (2015): 包含93个视频,手动标注了鱼的位置和种类。
  • RUIE (2019): 包含300张图像,包含三种海洋生物类别。
  • Brackish (2019): 包含89个视频,标注了6种粗分类的海洋生物。
  • Trash-ICRA19 (2019): 包含5,700张图像,标注了垃圾、生物物体和ROVs。
  • DUO (2021): 包含7782张图像,用于训练和测试。
  • FishNet (2023): 包含94,532张图像,来自17,357种水生物种,每个图像中的实例都标有边界框。
Object Tracking
  • UOT100 (2021): 包含104个视频序列,超过74,000个标注帧。
Semantic Segmentation
  • SUIM (2020): 包含超过1500张图像,标注了8个对象类别。
  • TrashCan (2020): 包含7212张图像,标注了四大类和多个子类。
  • UIIS (2023): 包含4,628张图像,用于水下实例分割任务,标注了7个类别。
Classification
  • Fish4Knowledge (2012): 包含27370张验证鱼图像。
  • FishCLEF-2015 (2015): 包含20,000张样本图像,15种鱼类。
  • WildFish (2018): 包含1000种鱼类,54,459张不受约束的图像。
  • FishNet (2023): 包含94,532张图像,来自17,357种水生物种。
AI搜集汇总
数据集介绍
main_image_url
构建方式
UnderwaterDataset 数据集的构建方式多样且系统,涵盖了从图像到视频的多模态数据。数据集包括了多种类型的数据,如原始图像(RawOnly)、配对图像(Paired)、深度信息(Depth)、深海图像(DeepSea)、合成数据(Synthetic)和实例数据(Instance)。这些数据通过不同的采集方法和处理技术获得,如使用专业水下摄像设备捕捉图像和视频,以及通过合成技术生成模拟水下环境的数据。此外,数据集还包括了不同水下环境下的数据,如浅水和深海,以及不同光照条件下的数据,以确保数据的多样性和广泛适用性。
特点
UnderwaterDataset 数据集的特点在于其多样性和专业性。首先,数据集包含了多种类型的数据,如图像、视频、深度信息和合成数据,这为不同类型的水下任务提供了丰富的资源。其次,数据集涵盖了多种水下环境,包括浅水和深海,以及不同的光照条件,这使得数据集具有广泛的应用场景。此外,数据集还包括了配对数据,即原始图像与其高质量参考图像的配对,这为图像增强和恢复任务提供了宝贵的资源。最后,数据集的构建过程中考虑了数据的多样性和代表性,确保了数据集在不同水下任务中的有效性和可靠性。
使用方法
UnderwaterDataset 数据集的使用方法灵活多样,适用于多种水下任务。首先,数据集可以用于图像增强和恢复任务,通过使用配对数据(原始图像和高质量参考图像)来训练和评估图像增强算法。其次,数据集可以用于目标检测和跟踪任务,通过使用标注的图像和视频数据来训练和评估目标检测和跟踪算法。此外,数据集还可以用于语义分割任务,通过使用像素级标注的图像数据来训练和评估语义分割算法。最后,数据集还可以用于分类任务,通过使用标注的图像数据来训练和评估分类算法。使用者可以根据具体任务的需求选择合适的数据类型和数据集子集,以实现最佳的训练和评估效果。
背景与挑战
背景概述
水下数据集(UnderwaterDataset)是近年来在海洋科学、计算机视觉和人工智能领域中备受关注的一个研究方向。该数据集由多个研究机构和学者共同创建,旨在为水下图像和视频的增强、检测、分割等任务提供丰富的数据资源。自2019年以来,该数据集不断扩展,涵盖了多种类型的数据,包括图像、视频、深度图和合成数据等。主要研究人员包括来自海法大学、密歇根大学和明尼苏达大学等机构的专家。核心研究问题集中在如何通过数据驱动的方法提升水下图像和视频的质量,从而支持海洋生物识别、环境监测和资源勘探等应用。该数据集的创建对水下视觉技术的进步具有重要推动作用,为相关领域的研究提供了坚实的基础。
当前挑战
水下数据集的构建面临诸多挑战。首先,水下环境的复杂性和多变性导致数据采集困难,图像和视频往往受到光线衰减、颜色失真和噪声干扰等问题的影响。其次,数据标注的准确性和一致性也是一个重要挑战,尤其是在涉及多类别、多层次的标注任务时。此外,水下数据集的多样性和规模要求高效的存储和处理技术,以支持大规模的训练和验证。最后,如何通过合成数据和真实数据的结合,提升模型的泛化能力和鲁棒性,也是当前研究的一个关键问题。这些挑战不仅影响了数据集的质量,也制约了相关算法和应用的发展。
常用场景
经典使用场景
在海洋科学和计算机视觉的交叉领域,UnderwaterDataset 数据集被广泛应用于水下图像增强、目标检测、语义分割和对象跟踪等经典场景。该数据集包含了多种类型的水下数据,如图像、视频、配对数据和原始数据,为研究人员提供了丰富的资源来开发和验证水下视觉算法。例如,通过使用该数据集,研究人员可以训练模型以增强水下图像的可见性,检测水下生物和物体,以及进行精确的语义分割和对象跟踪。
衍生相关工作
UnderwaterDataset 数据集的发布和使用催生了一系列相关的高影响力研究工作。例如,基于该数据集,研究人员开发了多种水下图像增强算法,如基于深度学习的图像恢复和颜色校正方法。此外,该数据集还促进了水下目标检测和语义分割技术的发展,推动了水下机器人和自主水下航行器的智能化和自动化。这些研究成果不仅在学术界引起了广泛关注,也在工业界得到了实际应用,推动了水下视觉技术的进步。
数据集最近研究
最新研究方向
近年来,水下数据集(UnderwaterDataset)在增强、检测、分割等领域的研究取得了显著进展。随着海洋探索和环境保护需求的增加,水下图像和视频数据的处理技术成为研究热点。最新的研究方向包括利用深度学习技术进行水下图像增强和恢复,如通过合成数据和真实数据相结合的方法提高模型的泛化能力。此外,水下目标检测和跟踪技术的研究也在不断深入,特别是在复杂水下环境中对不同种类海洋生物的识别和追踪。这些研究不仅推动了水下视觉技术的进步,也为海洋生态保护和资源管理提供了有力支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

2000-2018年中国典型生态系统植物生长节律数据

该数据集涵盖了森林、草地、荒漠、沼泽、农田生态系统2000年-2020年CERN长期定位监测的植物物候数据和主要作生育期数据,包括木本植物、草本植物、水稻、小麦、玉米物候数据表,木本植物数据表有18个台站、291个物种的芽开放期、展叶期、开花始期、开花盛期、果实或种子成熟期、叶秋季变色期和落叶期共计3814条记录;草本植物数据表有22个台站、312个物种的萌动期、开花期、果实或种子成熟期、种子散布期和黄枯期共计3032条数据;水稻数据表有9个台站的出苗期、拔节期、蜡熟期等10个生育期共551条记录;小麦数据表有9个台站不同生育期382条记录;玉米数据表有18个台站不同生育期532条数据。

地球大数据科学工程 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

COVID-19 Data Hub

COVID-19 Data Hub是一个全球性的COVID-19数据集,包含了来自多个国家和地区的疫情数据,涵盖了病例数、死亡数、康复数、测试数等信息。此外,数据集还包括了与疫情相关的经济、社会和政策数据。

covid19datahub.io 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录