GLORiA Dataset

github2025-09-26 更新2025-09-30 收录

下载链接：

https://github.com/Tech4DLab/GLORiA-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

GLORiA数据集是一个用于根据鱼类来源进行分类研究的图像集合，包含三种水产养殖和渔业中高度相关的物种：Argyrosomus regius（石首鱼）、Dicentrarchus labrax（欧洲海鲈）和Sparus aurata（金头鲷）。每个标本根据其来源分为三类：圈养（水产养殖）、逃逸（从养殖场逃到野外的个体）和野生。数据集按物种和类别组织文件夹，包含来自鱼市的测试图像，以及经过处理和增强的版本，可用于计算机视觉任务如自动分类、深度学习实验和野生与养殖鱼类的比较研究。

The GLORiA dataset is a curated collection of images designed for classification research focused on fish origin. It encompasses three species highly relevant to aquaculture and fisheries: Argyrosomus regius (sciaenid fish/meagre), Dicentrarchus labrax (European seabass), and Sparus aurata (gilthead seabream). Each specimen is categorized into three groups based on its origin: captive (aquaculture-raised), escaped (individuals that escaped from aquaculture farms into the wild), and wild. The dataset organizes folders by species and category, and includes test images sourced from fish markets, as well as processed and augmented versions suitable for computer vision tasks such as automated classification, deep learning experiments, and comparative studies between wild and farmed fish.

创建时间：

2025-09-24

原始信息汇总

GLORiA 数据集概述

数据集简介

GLORiA 数据集是一个用于根据鱼类来源进行分类研究的图像集合，包含三种水产养殖和渔业中高度相关的物种图像：

阿戈鱼（Argyrosomus regius，Meagre）
欧洲鲈鱼（Dicentrarchus labrax，European seabass）
金头鲷（Sparus aurata，Gilthead seabream）

分类体系

每个标本按照来源分为三个类别：

C：养殖（Captive，水产养殖）
E：逃逸（Escaped，从养殖场逃逸到野外的个体）
W：野生（Wild）

数据规模

数据集包含 7,884 张图像，具体分布如下：

来源类别	阿戈鱼	欧洲鲈鱼	金头鲷	总计
野生	0	724	2,455	3,179
逃逸	619	866	193	1,678
养殖	389	1,154	1,484	3,027
总计	1,008	2,744	4,132	7,884

数据结构

数据集按物种和类别组织文件夹结构：

data/A_regius/（C、E、W子文件夹）
data/D_labrax/（C、E、W子文件夹）
data/S_aurata/（C、E、W子文件夹）
data/test/（包含来自鱼市场的图像和Market.csv标签文件）

应用领域

计算机视觉任务中的自动分类
深度学习实验
野生与养殖鱼类的比较研究
水产养殖和可持续性的人工智能项目

许可信息

本项目采用 MIT 许可证。

项目背景

研究由"GLORiA-TOOLS"项目资助，该项目通过西班牙生态转型和人口挑战部生物多样性基金会的Pleamar计划支持，并由欧洲海洋、渔业和水产养殖基金共同资助。

搜集汇总

数据集介绍

构建方式

在渔业资源管理与水产养殖可持续发展的研究背景下，GLORiA数据集通过系统采集三种重要经济鱼类——欧洲狼鲈、金头鲷及细须石首鱼的图像样本构建而成。数据采集严格遵循物种来源分类标准，将每类样本划分为养殖个体、逃逸个体与野生个体三大类别，并采用分层存储结构组织图像数据。特别增设的市场测试集进一步扩展了数据场景的覆盖范围，同时通过数据增强技术提升了样本的多样性与代表性。

特点

该数据集的核心价值在于其聚焦鱼类来源分类的专有属性，涵盖7,884张高质量图像并呈现不均衡的类别分布特征，如金头鲷野生样本占比显著而细须石首鱼逃逸样本相对稀缺。图像数据通过专业标注体系构建了多维分类维度，既支持传统形态学差异研究，又能满足深度学习模型对复杂特征提取的需求。其特有的逃逸个体类别为研究养殖鱼类生态影响提供了不可替代的数据支撑。

使用方法

研究者可依据分层目录结构直接调用图像数据，通过加载市场测试集标签文件实现预测验证。该数据集适用于卷积神经网络训练、迁移学习实验等计算机视觉任务，建议采用交叉验证策略应对类别不均衡问题。经预处理和增强的衍生版本能有效提升模型泛化能力，最终输出结果可服务于水产追溯系统开发与渔业管理决策支持。

背景与挑战

背景概述

GLORiA数据集由西班牙阿利坎特大学计算机技术与海洋科学跨学科团队于2023年创建，聚焦于水产养殖与渔业可持续发展领域。该数据集通过采集欧洲鲈鱼、金头鲷和大西洋白姑鱼三类经济鱼种的图像，构建了涵盖野生、养殖及逃逸个体的多源分类体系，旨在量化不同来源鱼类的形态学差异。作为欧盟海洋与渔业基金支持项目GLORiA-TOOLS的核心成果，该数据集为人工智能技术在生态监测和物种溯源中的应用提供了标准化数据基础，推动了水产资源管理的数字化进程。

当前挑战

在鱼类溯源分类任务中，数据集需克服野生与养殖个体间细微形态差异的辨识难题，尤其逃逸个体兼具两类特征形成的过渡性表型。构建过程中面临样本采集的地理分布不均衡性，如野生大西洋白姑鱼样本缺失，同时需处理市场环境中光照反射与拍摄角度造成的图像噪声。跨学科协作要求海洋生物学特征与计算机视觉标注标准的深度融合，这对数据标注一致性与模型泛化能力提出了更高要求。

常用场景

经典使用场景

在渔业资源管理与水产养殖领域，GLORiA数据集为计算机视觉研究提供了关键支持。该数据集通过采集海鲈鱼、金头鲷等三种经济鱼类的野生、养殖及逃逸个体图像，构建了标准化的分类基准。研究者可基于深度学习方法，训练模型自动识别鱼类来源，有效分析不同生存环境对鱼类形态特征的影响，为生态学研究提供量化依据。

解决学术问题

该数据集有效解决了水产科学中鱼类溯源的核心难题。通过系统标注的视觉数据，研究者能够量化分析养殖与野生群体的形态差异，揭示环境适应性演化的规律。在生物多样性保护层面，该资源助力于逃逸个体对自然种群影响的评估，为制定可持续渔业政策提供了数据驱动的决策支持，推动了计算生态学与保护生物学的交叉融合。

衍生相关工作

基于GLORiA数据集衍生的研究已形成系列经典成果。多篇学术论文探索了注意力机制与迁移学习在鱼类分类中的创新应用，显著提升了跨环境图像的识别鲁棒性。部分工作进一步构建了鱼类行为与起源的关联模型，将静态图像分析扩展至动态生态评估。这些研究为欧盟蓝色增长战略提供了技术工具，并催生了多个水产智能监测国际合作项目。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集