FishPhenoKey
收藏arXiv2024-05-21 更新2024-06-21 收录
下载链接:
https://github.com/WeizhenLiuBioinform/Fish-Phenotype-Detect
下载链接
链接失效反馈官方服务:
资源简介:
FishPhenoKey是由武汉理工大学计算机科学与人工智能学院创建的综合性数据集,包含23,331张高分辨率图像,覆盖六种鱼类。该数据集特别设计了22个面向表型的标注点,用于捕捉鱼体部位精细复杂的形态表型。数据集的创建旨在解决水产养殖育种中精确形态量化的问题,为可持续水产养殖和遗传研究提供新的研究途径。
FishPhenoKey is a comprehensive dataset developed by the School of Computer Science and Artificial Intelligence, Wuhan University of Technology. It contains 23,331 high-resolution images covering six fish species. Specifically, 22 phenotype-oriented annotation points are designed for this dataset to capture the fine and complex morphological phenotypes of fish body parts. The dataset is created to solve the problem of precise morphological quantification in aquaculture breeding, providing new research avenues for sustainable aquaculture and genetic research.
提供机构:
武汉理工大学计算机科学与人工智能学院
创建时间:
2024-05-21
搜集汇总
数据集介绍

构建方式
FishPhenoKey数据集的构建旨在解决水产养殖育种中精确形态量化的问题。该数据集由23,331张高分辨率图像组成,涵盖六种鱼类,包括鲈鱼、草鱼、鲤鱼、斑点裸鲤、长吻鱼和斑点鲈鱼。这些图像是通过一个定制的图像采集设备在受控的实验室环境中捕捉活鱼获得的,以确保清晰的解剖特征,便于精确的 keypoints 标注和形态测量的准确性。为了测量鱼类身体部位的细微形态表型,数据集中定义了22个解剖学 keypoints,并在四种鱼类(鲈鱼、斑点裸鲤、草鱼和鲤鱼)的10,327张图像上进行了标注。此外,数据集还定义了23个形态表型,这些表型与 keypoints 的关系如图3所示。
特点
FishPhenoKey数据集的特点在于其大规模、多物种和 phenotype-oriented 的 keypoints 标注。它包含了23,331张鱼类图像,涵盖了六种常见的鱼类,这些图像均具有高分辨率,并包含了22个 phenotype-oriented 的解剖学 keypoints 标注。这使得 FishPhenoKey 成为第一个大型、多物种、面向 phenotype 的 keypoints 检测基准数据集。此外,FishPhenoKey 还提出了一种新的评估指标——Percentage of Measured Phenotype (PMP),该指标能够敏感地评估 phenotype 测量的准确性,从而确保对鱼类细微形态变化的精确评估。
使用方法
FishPhenoKey数据集的使用方法主要涉及 keypoints 检测网络架构的构建和训练。首先,使用 PyTorch 框架和 NVIDIA 4090 GPU 进行实验,以 HRNet 为骨干网络架构。其次,对鱼类图像进行裁剪和缩放,并进行随机旋转和缩放的数据增强。然后,使用 AdamW 优化器进行训练,并采用学习率衰减策略。最后,使用 PMP 指标评估 keypoints 检测的准确性,并使用 MAPE、Pearson 相关系数和 R2 等指标评估 phenotype 测量的准确性。通过实验,可以验证 ACR 模块在提高 keypoints 检测精度和 phenotype 测量准确性方面的有效性。
背景与挑战
背景概述
在精准养殖育种中,对鱼类形态的精准评估至关重要。现有的鱼类数据集通常存在规模较小、物种覆盖范围有限、关键点标注不足等问题,难以满足对鱼类身体部位精细和复杂形态表型的量化需求。为了填补这一空白,研究人员Weizhen Liu等人于2024年5月21日提出了FishPhenoKey数据集,该数据集包含23,331张高分辨率图像,涵盖六种鱼类。FishPhenoKey数据集的引入为鱼类表型分析设立了新的基准,解决了精准形态量化的问题,并为可持续养殖和遗传研究开辟了新的途径。
当前挑战
FishPhenoKey数据集在构建过程中面临了以下挑战:1) 缺乏专门针对形态表型测量的关键点标注;2) 现有的关键点检测评估指标,如OKS和PCK,并不完全适合鱼类关键点检测任务,因为这些指标缺乏对不同鱼类物种多样表型的敏感性。为了应对这些挑战,研究人员提出了一个新的评估指标PMP,该指标能够更准确地评估鱼类关键点检测的性能。此外,为了提高关键点检测的准确性,研究人员还提出了一种新的损失函数ACR,该函数可以集成到关键点检测模型中,利用生物学见解来细化关键点定位。
常用场景
经典使用场景
FishPhenoKey数据集,包含23,331张高分辨率图片,涵盖了六种鱼类,以及22种表型导向的注释,为精确测量鱼类身体部位的精细和复杂形态表型提供了重要资源。该数据集主要用于鱼类表型分析,包括种群研究、功能基因研究、鱼类健康评估、新品种开发以及可持续水产养殖实践等方面。通过FishPhenoKey数据集,研究人员可以精确量化鱼类的形态表型,从而推动可持续水产养殖和遗传研究的发展。
实际应用
FishPhenoKey数据集在实际应用中具有广泛的前景。例如,在鱼类养殖和育种中,通过精确测量鱼类的形态表型,可以评估鱼类的生长状况、健康状况以及遗传特性等,从而为鱼类的品种改良和养殖管理提供科学依据。此外,FishPhenoKey数据集还可以用于鱼类表型分析,为鱼类生物多样性和进化研究提供数据支持。
衍生相关工作
FishPhenoKey数据集的发布和研究成果,为鱼类表型分析和关键点检测领域的研究提供了新的思路和方向。基于FishPhenoKey数据集,研究人员可以开发出更精确的鱼类形态表型测量方法,从而推动鱼类养殖和育种的发展。此外,FishPhenoKey数据集提出的PMP评估指标和ACR损失函数,也为关键点检测领域的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



