Labeled Fishes in the Wild 鱼类标注数据集|水下生物识别数据集|图像分析数据集

帕依提提2024-03-04 收录

水下生物识别

图像分析

下载链接：

https://www.payititi.com/opendatasets/show-26413.html

下载链接

链接失效反馈

资源简介：

Labeled Fishes in the Wild 为鱼类图像数据集，图像中包含鱼类、无脊椎动物和河床，通过部署在远程操作潜水器上的渔业统计摄像系统拍摄得到的。鱼类位置数据被包括在相应的数据文件中（ dat，vec 和 info），标注了鱼在图像中的位置。该野生鱼类标记图像数据集是由NOAA渔业（国家海洋渔业服务机构），以鼓励开发，测试，以及为不受约束的水下图像自动图像分析算法的性能评估。数据集包括鱼，无脊椎动物和海床的图像，这些图像是使用部署在遥控车（ROV）上的摄像系统采集的，用于渔业调查。注释数据包含在随附的数据文件（.dat，.vec和.info）中，这些文件描述了图像中标记的鱼目标的位置。该手稿（Cutter等人，2015年）演示了基于使用训练图像数据集开发并使用测试集进行评估的分类器自动检测鱼类的方法。该数据集可用于进一步开发复杂环境中鱼类或无脊椎动物的检测；跟踪视频图像序列中的多个动物目标；动物种类的识别和分类；立体图像对中动物的测量；和海底栖息地的特征。推荐引用：G. Cutter；K. Stierhoff；Zeng，J.（2015）“使用Haar级联和新的图像数据集在不受约束的水下视频中自动检测石鱼：带标签的野外鱼类，” IEEE计算机视觉应用冬季研讨会，第57-62页。负责这些数据的NOAA科学家可能拥有图像档案，这些档案可以为协作应用和评估算法提供额外的机会。应该在出版物中提供使用这些数据集的信誉，如数据集存档中包含的“ how-to-cite.txt”文档中所述或如上所述。野生图像数据集（v.1.1）中带有标签的鱼。带有标签的野生鱼具有三个组成部分：训练和验证的正图像集（已验证的鱼），负图像集（非鱼）和测试图像集。训练和测试集具有随附的注释数据，这些数据定义了图像中每个标记的鱼目标对象的位置和范围。这些代表专家分析人员定义的边界矩形，格式为OpenCV使用的.dat文件。培训和验证正面图像集：包含石斑鱼（Sebastes spp。）和海床附近的其他相关物种的图像，这些图像是使用部署在遥控车辆（ROV）上的前斜向数码相机拍摄的由西南渔业科学中心在对加利福尼亚南部沿海的岩石海底环境进行调查期间。这些摄像机的静止帧代表ROV缓慢移动且运动影响不是影响因素的调查期间的实例。训练集包含929个图像文件，其中包含1005个带有相关注释的标记鱼（它们的标记位置和边界矩形）。这些标记定义了相机的各种物种，大小和范围的鱼，并且包括背景组成不同的部分。培训和验证负面图片集：包括3167张图片。在野外训练和测试图像集中，从带标签的鱼中提取了可下载档案中提供的147个海底负图像（提取了不含鱼的区域）。其余3020张图像可从 OpenCV HaarTraining上的教程中获得，也可从 data negatives目录中获得。测试图像集：包含在近海底鱼类调查期间使用ROV的高清（HD; 1080i）摄像机收集的图像序列。用于检测的测试图像包括来自ROV调查的视频镜头。用于评估本研究检测器的视频片段（“ TEST_VIDEO_ROV10.mp4”； 210帧，每秒3帧（fps））代表原始视频序列的第10帧（2分钟，约30 fps）。对于210帧3fps测试视频，所有鱼目标均带有注释。测试视频中鱼的注释包括“已验证”或“明显”的描述符，其中已验证表明视频分析人员可以识别出鱼，并且明显的物体被认为是鱼，但无法根据单个框架中可见的属性进行验证。这些明显的鱼在远处看起来像淡淡的斑点。这些区别是在注释数据中进行的，因为我们认为某些分类器会检测到这些明显的鱼，但我们不希望分类器能够这样做。我们也不一定要探测器这样做。也就是说，如果分类器正在检测那些明显的鱼类，那么它可能正在检测图像中的许多其他非鱼类目标，从而使其效率低下且不切实际。在数据集测试视频的带注释的帧中总共标记了2061个鱼对象。其中，有1008条是经过验证的鱼，而1053条是明显的鱼。在序列中，ROV正在移动；背景似乎正在移动并且从不同方向被照亮（随着ROV的移动和旋转）；水流中的小颗粒流过去；鱼静止或以各种速度运动；鱼有很多方向。一些鱼被部分地藏在岩石或缝隙中；远处出现一些模糊的鱼状物体。野生数据集（v1.0，2014年12月）中的原始Labeled鱼类仅包含抽取后的测试视频序列（“ Test_ROV_video_h264_decim.mp4”），该序列仅包含原始视频中的标记帧。完整帧率视频的十分之一帧被标记为鱼类目标的位置。此版本的数据集（v1.1，2015年1月）还包含完整的测试视频序列（“ Test_ROV_video_h264_full.mp4”）。完整视频和抽取后的视频都带有附带分析标记的文本文件（遵循OpenCV .dat文件约定）。通常，对于m个标记，格式为：视频文件名（帧号）标记数x1 y1 w1 h1 x2 y2 w2 h2 ... xm ym wm hm。例如，如果有两个标记，最后的8个值定义边界矩形：Test_ROV_video_h264_full.mp4（fr_14）2 1021 362 94 63 953 289 9061。抽取视频的标记文件（“ Test_ROV_video_h264_decim_marks.dat”）指示抽取和完整序列的帧号，例如Test_ROV_video_h264_decim.mp4（fr_1）（fullfr_14）2 1021 362 94 63 953 289 9061。完整视频中有2101帧，抽取后的视频中有210帧，但是标记了206帧；即，一些检查的框架不包含鱼。）表示抽取和完整序列的帧号，例如Test_ROV_video_h264_decim.mp4（fr_1）（fullfr_14）2 1021 362 94 63 953 289 9061。抽取后的视频中有2101帧，抽取后的视频中有210帧，但是206标有框架；即，一些检查的框架不包含鱼。）表示抽取和完整序列的帧号，例如Test_ROV_video_h264_decim.mp4（fr_1）（fullfr_14）2 1021 362 94 63 953 289 9061。抽取后的视频中有2101帧，抽取后的视频中有210帧，但是206标有框架；即，一些检查的框架不包含鱼。

提供机构：

帕依提提

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

密云区2022年常住人口情况

该数据是密云区提供的密云区2022年常住人口情况信息，包括1个文本。

北京市公共数据开放平台收录

Materials Project 在线材料数据库

Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算，为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果，以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性，还涵盖了电子结构和热力学性质等详尽信息，为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。

超神经收录

TM-Senti

TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集，包含超过1.84亿条推文，覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档，可以完全重新构建，包括推文元数据且无缺失推文。数据集内容丰富，涵盖多种语言，主要用于情感分析和文本分类等任务。创建过程中，研究团队精心筛选了表情符号和表情，确保数据集的质量和多样性。该数据集的应用领域广泛，旨在解决社交媒体情感表达的长期变化问题，特别是在表情符号和表情使用上的趋势分析。

arXiv 收录

Multi-Text CIR (MTCIR)

MTCIR是一个大规模的合成数据集，包含340万图像对和1770万修改文本。该数据集由亚马逊公司收集，旨在解决组合图像检索领域数据不足的问题，通过多模态大型语言模型生成图像对的修改文本，并提供了多个简短的修改文本，以覆盖各种属性，更好地反映人类查询构建方式，为CIR模型提供更真实、全面的训练基础。

arXiv 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像，每张图像均给出对应的人名，共有5749人，且绝大部分人仅有一张图片。每张图片的尺寸为250X250，绝大部分为彩色图像，但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录