five

eLasmobranc Dataset – Sharks & Rays (v1.0)

收藏
github2026-02-11 更新2026-02-12 收录
下载链接:
https://github.com/Tech4DLab/eLasmobranc-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
eLasmobranc数据集是一个图像集合,旨在支持计算机视觉研究和科学分析,专注于识别板鳃亚纲物种(鲨鱼和鳐鱼)。该数据集由阿利坎特大学的e-Lasmobranc项目开发,是一个开放且不断发展的资源。版本1.0包含1,117张图像,对应807个不同的个体,属于七个目标板鳃亚纲物种。大多数图像是在水外拍摄的,以减少视觉失真并确保形态特征的清晰可见。所有样本都经过专家验证,以保证正确的物种识别和足够的形态信息。数据集适用于物种分类、零样本和小样本学习、形态驱动的识别和海洋生物多样性研究。

The eLasmobranc Dataset is a collection of images developed to support computer vision research and scientific analysis, focusing on the identification of Elasmobranchii species (sharks and rays). Developed by the e-Lasmobranc Project at the University of Alicante, this dataset is an open and evolving resource. Version 1.0 contains 1,117 images corresponding to 807 distinct individuals belonging to seven target Elasmobranchii species. Most images are captured out of water to reduce visual distortions and ensure the clear visibility of morphological features. All samples have been verified by experts to ensure accurate species identification and sufficient morphological information. The dataset is applicable to tasks including species classification, zero-shot and few-shot learning, morphology-driven identification, and marine biodiversity research.
创建时间:
2026-02-07
原始信息汇总

eLasmobranc 数据集概述

数据集简介

eLasmobranc 数据集是一个图像集合,旨在支持专注于板鳃类物种(鲨鱼和鳐鱼)识别的计算机视觉研究和科学分析。该数据集由阿利坎特大学的 e-Lasmobranc 项目开发,是一个开放且持续演进的资源。它整合了来自公共知识共享来源的图像以及通过合作和实地考察收集的原始材料。

版本与规模

  • 版本: 1.0
  • 总图像数量: 1,117
  • 独立个体数量: 807
  • 目标物种数量: 7

包含物种

数据集包含以下七个板鳃类物种:

  • Galeorhinus galeus
  • Galeus melastomus
  • Leucoraja naevus
  • Mustelus mustelus
  • Oxynotus centrina
  • Scyliorhinus canicula
  • Torpedo marmorata

数据特征

  • 图像质量:大多数图像在离水环境下拍摄,以最小化视觉畸变并确保形态特征的清晰可见。
  • 质量控制:所有样本均经过基本质量标准的筛选,并由专家验证,以确保物种识别正确且形态信息充足。
  • 图像来源
    • 外部来源(公共数据集和网络平台):约 80%
    • 内部来源(实地考察和合作):约 20%

元数据

每张图像均提供标准化的元数据,包括:

  • 观测日期 (DD-MM-YYYY)
  • 原产国和地区
  • 原始来源和许可证

数据集结构

数据集目录结构如下:

. ├── data/ │ ├── galeorhinus_galeus/ │ │ ├── GG_001_01.jpg │ │ ├── ... │ │ └── GG_metadata.csv │ ├── galeus_melastomus/ │ ├── leucoraja_naevus/ │ ├── mustelus_mustelus/ │ ├── oxynotus_centrina/ │ ├── scyliorhinus_canicula/ │ └── torpedo_marmorata/ │ ├── Elasmobranch taxonomic keys.xlsx # 各物种的形态特征 ├── attributions.csv # 图像来源、许可证和归属文本 └── citations.txt # 所有数据源的引用参考文献

每个物种文件夹包含:

  • 由物种-个体-图像唯一ID编码的图像(例如,GG_001_01)
  • 一个包含每张图像元数据的物种特定CSV文件

各物种图像数量统计

板鳃类物种 图像数量
Galeorhinus galeus 79
Galeus melastomus 31
Leucoraja naevus 103
Mustelus mustelus 198
Oxynotus centrina 32
Scyliorhinus canicula 575
Torpedo marmorata 99

关键特性

  • 首个专门用于板鳃类物种识别的开放数据集。
  • 经过专家验证的图像,具有可见的诊断性形态特征。
  • 标准化的时间和地理元数据。
  • 包含外部知识资源(分类学检索表)以支持基于形态学的方法。
  • 适用于海洋科学研究和计算机视觉研究。

预期用途

数据集适用于以下任务:

  • 物种分类
  • 零样本和小样本学习
  • 基于形态学的识别
  • 海洋生物多样性研究

许可证

eLasmobranc 数据集根据 CC-BY-NC 许可证分发。来自外部来源的图像额外保留了其原始的知识共享许可证,所有许可证信息均在 attributions.csv 文件中明确记录。

项目与资金支持

该研究由 eLasmobranc 项目资助。该项目在生态转型与人口挑战部生物多样性基金会的合作下开发,通过 Pleamar 计划,并由欧盟通过欧洲海洋、渔业和水产养殖基金共同资助。

联系方式

姓名 角色 联系邮箱 部门
Ismael Beviá Ballesteros 数据管理员 ismael.bevias@ua.es 计算机技术
Nieves Aranda Garrido 数据收集员 海洋研究中心
Mario Jerez Tallón 研究员 海洋研究中心
Isabel Abel Abellan 数据管理员 海洋研究中心
Irene Antón Linares 研究员 海洋研究中心
Marcelo Saval Calvo 主管 计算机技术
Jorge Azorín López 主管 - 计算机技术
Andrés Fuster Guilló 项目负责人 fuster@ua.es 计算机技术
Francisca Giménez-Casalduero 项目负责人 海洋研究中心
搜集汇总
数据集介绍
main_image_url
构建方式
在海洋生物多样性研究领域,高质量图像数据的稀缺性制约了计算机视觉技术的应用。eLasmobranc数据集的构建依托于阿利坎特大学e-Lasmobranc项目的框架,采用开放且持续演进的资源整合策略。该数据集融合了来自公共知识共享平台的外部图像与通过实地考察及合作采集的内部原创素材,共收录1,117张图像,涵盖七个目标板鳃亚纲物种的807个独立个体。为确保数据的科学可靠性,所有图像均经过基础质量筛选,并由专家进行物种鉴定与形态特征验证,同时每张图像均附有标准化的元数据,包括观测日期、地理来源及原始许可信息。
特点
作为首个专注于板鳃亚纲物种识别的开放数据集,eLasmobranc数据集在海洋科学与计算机视觉交叉领域展现出独特价值。其核心优势在于所有图像均经过专家验证,清晰呈现可用于分类诊断的形态学特征,如皮肤纹理、鳍形结构等关键性状。数据集提供了标准化的时空与地理元数据,支持溯源分析与生态学研究。此外,配套的物种分类学关键性状表格为形态驱动识别方法提供了外部知识资源,使得该数据集不仅能用于传统物种分类任务,也适用于零样本学习、少样本学习等前沿机器学习场景。
使用方法
为便于研究应用,数据集采用层级目录结构组织,每个物种拥有独立文件夹,内含以‘物种-个体-图像’规则命名的图像文件及对应的元数据CSV文件。用户可依据attributions.csv文件追溯每张图像的来源与许可协议,确保合规使用。在计算机视觉任务中,该数据集可直接用于训练卷积神经网络进行物种分类,或结合附带的形态性状表格开发可解释的识别模型。在海洋生物学领域,研究者可利用其丰富的元数据开展物种分布、种群形态变异等分析。数据集遵循CC-BY-NC许可分发,外部图像则保留其原始知识共享许可,使用时需遵循引用规范。
背景与挑战
背景概述
在海洋生物多样性研究与计算机视觉交叉领域,物种自动识别技术正成为生态监测与保护的关键工具。eLasmobranc数据集由阿利坎特大学e-Lasmobranc项目于2026年创建,旨在为板鳃亚纲物种(鲨鱼与鳐鱼)的识别提供专项图像资源。该数据集汇集了1117张图像,涵盖七个目标物种的807个独立个体,每张图像均经过专家验证,并附有标准化时空元数据。作为首个专注于板鳃类物种识别的开放数据集,它不仅支持物种分类、少样本学习等计算机视觉任务,也为形态学驱动的海洋生物研究提供了基础数据,推动了跨学科方法在海洋科学中的应用。
当前挑战
板鳃类物种识别面临诸多固有挑战:水下图像常受光线散射、水体浑浊及姿态变化干扰,导致关键形态特征模糊;物种间形态相似度高,需依赖细微的解剖差异进行区分,这对模型的细粒度识别能力提出严峻考验。在数据集构建过程中,研究人员需克服野外样本获取困难、图像质量参差不齐等问题,通过离水拍摄确保形态特征清晰可见,并整合约80%的外部公开数据与20%的实地采集数据,在专家验证下完成物种标注与元数据标准化,以保障数据的科学可靠性。
常用场景
经典使用场景
在海洋生物学与计算机视觉交叉领域,eLasmobranc数据集为软骨鱼类物种识别提供了关键资源。其经典使用场景集中于物种分类任务,研究人员利用该数据集训练深度学习模型,以自动识别七种目标鲨鱼和鳐鱼物种。由于图像在出水环境下拍摄,形态特征清晰可见,数据集特别适用于基于形态学特征的识别方法,支持零样本和小样本学习,助力于在数据稀缺环境下提升模型泛化能力。
衍生相关工作
围绕eLasmobranc数据集,已衍生出多项经典研究工作。例如,研究人员结合数据集提供的形态学分类键,开发了注意力机制模型以聚焦关键鉴别特征,提升物种分类精度。此外,该数据集被用于跨域适应研究,将陆生动物识别模型迁移至海洋物种场景。这些工作不仅推动了软骨鱼类计算机视觉识别技术的发展,也为海洋生物信息学建立了可扩展的分析框架。
数据集最近研究
最新研究方向
在海洋生物多样性保护与计算机视觉交叉领域,eLasmobranc数据集作为首个专注于板鳃类物种识别的开放资源,正推动前沿研究向形态学驱动的细粒度识别方向发展。该数据集整合了专家验证的图像与标准化元数据,为少样本与零样本学习提供了关键支撑,助力应对野外数据稀缺的挑战。当前研究热点集中于利用其附带的形态特征分类键,开发可解释性人工智能模型,以提升物种自动识别的准确性与可靠性,这对于海洋生态监测和濒危物种保护具有重要科学意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作