five

FishPhenoKey|水产养殖数据集|形态特征分析数据集

收藏
github2024-05-31 收录
水产养殖
形态特征分析
下载链接:
https://github.com/WeizhenLiuBioinform/Fish-Phenotype-Detect
下载链接
链接失效反馈
资源简介:
FishPhenoKey数据集由武汉理工大学、上海人工智能实验室等机构联合构建,旨在精确评估水产养殖中鱼类的细微形态特征。该数据集包含了23,331张高分辨率图像,涵盖了6种不同的鱼类,其显著特点之一是包含了22个面向表型的注释,这些注释使得能够捕捉到复杂的形态表型。对于其中的4种鱼类,共有10,327张图像被标注了22个人体解剖学上的关键点,这些关键点被特别定义出来,用于测量多达23种对鱼类养殖者感兴趣的微妙形态表型。FishPhenoKey数据集克服了以往数据集规模小、物种覆盖有限及关键点标注不足等限制,为鱼类形态学研究提供了宝贵的资源。

The FishPhenoKey dataset, jointly constructed by institutions such as Wuhan University of Technology and the Shanghai Artificial Intelligence Laboratory, aims to precisely evaluate the subtle morphological characteristics of fish in aquaculture. This dataset comprises 23,331 high-resolution images, covering six different fish species. One of its notable features is the inclusion of 22 phenotype-oriented annotations, which enable the capture of complex morphological phenotypes. For four of these fish species, a total of 10,327 images have been annotated with 22 key anatomical points, specifically defined to measure up to 23 subtle morphological phenotypes of interest to fish farmers. The FishPhenoKey dataset overcomes the limitations of previous datasets, such as small scale, limited species coverage, and insufficient key point annotations, providing a valuable resource for the study of fish morphology.
提供机构:
武汉理工大学、上海人工智能实验室等
原始信息汇总

数据集概述

数据集名称

  • FishPhenoKey

数据集内容

  • 包含23,331张高分辨率JPG图像,涵盖六种鱼类。
  • 每种鱼类从两个不同视角拍摄。
  • 四种鱼类被精确标注,用于测量鱼体部分的微妙形态表型。
  • 包含22个关键点标注,用于详细描述鱼类的形态特征。

关键点定义

  1. 鼻尖
  2. 鳃盖后端
  3. 头部顶端
  4. 峡部
  5. 背峰
  6. 腹缘底端
  7. 尾柄顶端
  8. 尾柄底端
  9. 尾鳍后端
  10. 尾椎后端
  11. 眼前端
  12. 眼后端
  13. 胸鳍前端
  14. 胸鳍后端
  15. 腹鳍前端
  16. 腹鳍后端
  17. 臀鳍前端
  18. 臀鳍后端
  19. 臀鳍外缘
  20. 背鳍前端
  21. 背鳍后端
  22. 背鳍外缘

数据集获取

引用信息

  • 若使用此数据集,请引用以下文献:

    @article{liu2024benchmarking, title={Benchmarking Fish Dataset and Evaluation Metric in Keypoint Detection-Towards Precise Fish Morphological Assessment in Aquaculture Breeding}, author={Liu, Weizhen and Tan, Jiayu and Lan, Guangyu and Li, Ao and Li, Dongye and Zhao, Le and Yuan, Xiaohui and Dong, Nanqing}, journal={arXiv preprint arXiv:2405.12476}, year={2024} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
FishPhenoKey数据集的构建旨在解决当前水产养殖中形态学数据不足的问题。该数据集包含了23,331张高分辨率图像,涵盖六种鱼类,每种鱼类从两个不同视角拍摄。通过渔业专家的指导,对其中四种鱼类进行了22个关键点的精确标注,这些关键点涵盖了鱼体各部位的细微形态特征。FishPhenoKey的设计不仅注重图像质量,还强调了标注的准确性和多样性,以支持复杂形态特征的精确测量。
特点
FishPhenoKey数据集的主要特点在于其高分辨率图像和详尽的标注。每张图像都经过精心挑选,确保了图像质量的高标准。此外,数据集的标注涵盖了22个关键点,这些关键点定义了鱼体各部位的精确位置,为形态学分析提供了丰富的数据支持。FishPhenoKey的模块化设计使其能够灵活适应不同的评估指标和关键点检测模型,确保了数据集的可扩展性和持续更新能力。
使用方法
使用FishPhenoKey数据集时,用户需先下载并阅读《FishPhenoKey数据集用户协议》,同意相关条款后填写用户信息并发送至指定邮箱。审核通过后,用户将获得数据集的下载链接。在环境设置方面,建议使用Python 3.6/3.7/3.8、Pytorch 1.10及以上版本,并安装pycocotools。推荐在Ubuntu或CentOS系统上使用GPU进行训练,详细的环境配置可参考requirements.txt文件。
背景与挑战
背景概述
在现代水产养殖业中,精确的形态学分析对于优化育种策略至关重要。然而,现有的鱼类形态学数据集规模较小,物种有限,且缺乏全面的标注,难以满足复杂形态特征的精确测量需求。为此,武汉理工大学计算机科学与人工智能学院的研究团队与上海人工智能实验室等机构合作,于2024年推出了FishPhenoKey数据集。该数据集包含23,331张高分辨率图像,涵盖六种鱼类,并标注了22个关键点,旨在为水产养殖中的精确形态评估提供支持。FishPhenoKey的推出不仅填补了现有数据集的空白,还为高级水产养殖研究和遗传学研究提供了宝贵的资源。
当前挑战
FishPhenoKey数据集在构建过程中面临多重挑战。首先,高分辨率图像的采集和处理需要先进的成像技术和计算资源,以确保数据的清晰度和准确性。其次,对鱼类形态学关键点的精确标注需要专业的渔业专家参与,增加了数据集构建的复杂性和成本。此外,数据集的多样性和扩展性要求设计灵活的模块化结构,以适应未来不同评估指标和检测模型的需求。最后,数据集的发布和使用需遵循严格的法律和伦理规范,确保数据的安全性和隐私保护。这些挑战不仅影响了数据集的构建效率,也对其在实际应用中的效果提出了考验。
常用场景
经典使用场景
FishPhenoKey数据集在鱼类形态学评估中展现了其经典应用场景。通过提供23,331张高分辨率图像,涵盖六种鱼类,并标注了22个关键点,该数据集为精确测量鱼类复杂形态特征提供了坚实基础。研究者可以利用这些详细标注的图像,开发和验证用于鱼类形态分析的计算机视觉模型,从而推动水产养殖中的遗传研究和品种改良。
衍生相关工作
FishPhenoKey数据集的发布催生了多项相关研究工作。例如,基于该数据集的鱼类关键点检测算法研究,显著提升了检测精度和速度。此外,有研究利用FishPhenoKey进行鱼类形态特征与遗传多样性之间的关联分析,为育种策略提供了新的视角。还有工作探讨了如何将FishPhenoKey应用于多物种鱼类形态比较研究,推动了跨物种形态学分析的发展。这些衍生工作不仅丰富了鱼类研究的方法论,也为实际应用提供了技术支持。
数据集最近研究
最新研究方向
在现代水产养殖领域,精确的形态学评估对于优化育种策略至关重要。FishPhenoKey数据集的最新研究方向聚焦于通过高分辨率图像和详细的形态学关键点标注,提升鱼类形态特征的检测精度。该数据集不仅涵盖了六种鱼类的高质量图像,还通过22个关键点的精确标注,为复杂形态特征的测量提供了坚实基础。这一研究方向不仅推动了水产养殖中的形态学分析技术,还为遗传学研究提供了新的数据支持,预示着在精准农业和生物多样性保护中的深远影响。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。

国家青藏高原科学数据中心 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录

ACDC(Automated Cardiac Diagnosis Challenge)

自动心脏诊断挑战 (ACDC) 挑战的目标是:比较自动方法在将左心室心内膜和心外膜分割为舒张末期和收缩末期实例的右心室心内膜方面的性能;比较自动方法对五类检查(正常病例、心力衰竭伴梗死、扩张型心肌病、肥厚型心肌病、右心室异常)的分类性能。整个 ACDC 数据集是根据在第戎大学医院获得的真实临床检查创建的。获得的数据完全匿名,并根据第戎医院(法国)当地伦理委员会制定的规定进行处理。我们的数据集涵盖了几个定义明确的病理学,并有足够的案例来 (1) 正确训练机器学习方法和 (2) 清楚地评估从电影 MRI 获得的主要生理参数的变化(特别是舒张期容积和射血分数)。该数据集由 150 个检查(全部来自不同的患者)组成,分为 5 个均匀分布的亚组(4 个病理组和 1 个健康受试者组),如下所述。此外,每位患者都附带以下附加信息:体重、身高以及舒张期和收缩期瞬间。该数据库在个人注册后通过专用在线评估网站的两个数据集提供给参与者:i) 100 名患者的培训数据集以及基于一位临床专家分析的相应手册参考; ii) 由 50 名新患者组成的测试数据集,没有手动注释,但有上面给出的患者信息。原始输入图像通过 Nifti 格式提供。

OpenDataLab 收录