imageomics/questFish2024
收藏Hugging Face2025-07-22 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/imageomics/questFish2024
下载链接
链接失效反馈官方服务:
资源简介:
QUEST Fish 2024数据集包含从普林斯顿大学附近水域收集的鱼类图像,主要用于图像分类任务。数据集的结构包括多个文件夹,每个文件夹中包含多个图像文件,图像文件以<img_id>.png或.jpeg命名。数据集的创建目的是让教师体验生态学家的工作,通过手动测量鱼类及其周围环境的数据。数据集使用CC0许可证,表示其已进入公共领域。
The QUEST Images of Fish from QUEST 2024 dataset contains images of fish collected from bodies of water near Princeton University. These images are part of a project aimed at allowing teachers to experience life as an ecologist, focusing on fish and their surrounding environments. The images in the dataset are organized into folders named by participants, with filenames as <img_id>.png or .jpeg. The dataset is dedicated to the public domain using the CC0 Public Domain Waiver. The dataset is supported by Princeton Universitys QUEST Teacher Preparation Program and the Imageomics Institute, funded by the US National Science Foundation.
提供机构:
imageomics
原始信息汇总
数据集卡片:QUEST Fish 2024
数据集描述
- 名称: QUEST Images of Fish from QUEST 2024
- 标签:
- biology
- image
- animals
- CV
- fish
- species
- NJ fish
- 大小类别: n<1K
- 任务类别: image-classification
- 语言: en
- 许可证: cc0-1.0
数据集详情
数据集描述
- 主页: QUEST 2024
数据集结构
/dataset/ <group_1>/ <img_id 1>.png <img_id 2>.png ... <img_id n>.png <group_1>/ <img_id 1>.png <img_id 2>.png ... <img_id n>.png ... <group_1>/ <img_id 1>.png <img_id 2>.png ... <img_id n>.png metadata.csv
数据实例
- 所有图像文件名为
<img_id>.png或.jpeg,每个图像文件位于一个文件夹中。 - 文件夹由QUEST项目的参与者命名,图像来自各种手机拍摄,未进行标准化处理。
数据字段
[更多信息需补充]
数据集创建
数据集创建理由
- 这些图像与教师收集的数据(未包含在此)合并,使教师体验生态学家的生活,以鱼类为研究对象并进行测量。
- 测量由人工进行,涉及鱼类及其周围区域。
许可证信息
- 该数据集已通过CC0公共领域放弃声明标记为公共领域。
致谢
- 本工作由普林斯顿大学支持,作为QUEST教师准备项目的一部分,并得到Imageomics研究所的额外支持,该研究所由美国国家科学基金会的Harnessing the Data Revolution (HDR)计划资助,项目编号为Award #2118240。
搜集汇总
数据集介绍

构建方式
在生态学与计算机视觉交叉领域,QUEST Fish 2024数据集通过实地采集构建而成。该数据集源自普林斯顿大学附近的自然水域,由QUEST 2024项目的参与者使用多种手机设备拍摄鱼类图像,未进行标准化处理。图像数据与一份包含环境及形态测量值的CSV文件(fieldData2024.csv)相结合,其中测量数据如水温、流速、深度以及鱼类的体长、头宽等形态指标均由人工目测记录,旨在模拟生态学家在野外采集多模态数据的真实场景。
特点
该数据集的核心特点在于其多模态与生态学导向的数据结构。图像部分涵盖了10种不同鱼类物种,以PNG或JPEG格式存储,图像命名与组织方式较为自由。配套的元数据不仅包含物种分类与图像URL,还详细记录了采集点的环境参数(如水温、流速)以及基于目测的鱼类形态测量值(如体长、头宽)及其衍生比率。这种将视觉数据与环境、形态指标整合的设计,为研究物种识别、形态与环境关联性提供了独特的多维度视角。
使用方法
该数据集适用于图像分类及生态信息学相关研究。用户可通过HuggingFace平台访问数据集,利用fieldData2024.csv中的photoURL字段链接至对应图像,并结合物种标签、环境测量值及形态数据进行分析。鉴于数据以CC0许可公开,研究者可自由将其用于训练或评估计算机视觉模型,尤其适合探索在非标准化拍摄条件下,如何融合视觉特征与生态测量数据以提升物种识别或生态性状预测的模型性能。
背景与挑战
背景概述
在计算生物学与生态学交叉领域,图像组学(Imageomics)作为新兴前沿,致力于通过知识引导的机器学习从生物图像中提取深层信息。QUEST Fish 2024数据集由普林斯顿大学QUEST教师培训项目与图像组学研究所于2024年联合创建,旨在为生态学教育与实践提供真实场景下的鱼类图像资源。该数据集聚焦于新泽西州普林斯顿大学周边水域的鱼类,核心研究问题在于探索环境参数与鱼类形态特征之间的关联,为物种识别、生态适应性分析及生物多样性监测提供数据基础。其创建不仅推动了图像组学在生态教育中的应用,也为跨学科研究提供了珍贵的野外实测数据。
当前挑战
该数据集旨在解决野外环境下鱼类物种识别与形态特征分析的挑战,其核心问题在于如何从非标准化、多样化的真实世界图像中准确提取生物信息。构建过程中面临多重困难:图像采集由多位参与者使用不同手机设备完成,缺乏统一的光照、角度与分辨率标准,导致数据异构性显著;形态测量依赖于人工目测,引入了主观误差与度量单位的不一致性;此外,数据集规模较小(不足千张),物种覆盖有限,可能制约模型泛化能力。这些因素共同构成了数据质量与可用性的关键瓶颈。
常用场景
经典使用场景
在生态学与计算生物学交叉领域,QUEST Fish 2024数据集为物种识别与形态分析提供了宝贵的视觉资源。该数据集收录了普林斯顿大学周边水域的鱼类图像,并附有环境参数与形态测量数据,其经典应用场景在于训练和验证图像分类模型,特别是针对自然环境下非标准化拍摄的鱼类图像进行物种自动识别。研究者可利用这些多样化的图像数据,探索机器学习模型在复杂真实场景中的鲁棒性与泛化能力,为生态监测中的自动化物种鉴定奠定基础。
实际应用
在实际生态监测与公民科学项目中,QUEST Fish 2024数据集具有直接的应用价值。其数据采集源于教师培训项目,模拟了野外生态学家的实地工作流程,因此该数据集可用于开发面向教育或公众参与的科学工具,例如辅助野外调查的移动端鱼类识别应用程序。同时,整合的环境测量数据也能为水域生态系统健康评估提供参考,助力生物多样性保护和环境管理决策。
衍生相关工作
围绕该数据集所代表的非标准化野外图像分类问题,已催生了一系列相关研究方法。例如,针对图像光照、角度和背景的异质性,研究者发展了数据增强、域自适应和少样本学习技术以提升模型性能。此外,结合形态测量与环境数据的多任务学习框架,也成为从图像中同时推断物种与生态特征的新兴方向。这些工作共同推动了计算机视觉在野外生物监测和图像组学(Imageomics)领域的深入应用。
以上内容由遇见数据集搜集并总结生成



