five

HierArchical Leaf Vein Segmentation (HALVS)

收藏
arXiv2024-05-16 更新2024-06-21 收录
下载链接:
https://github.com/WeizhenLiuBioinform/HALVS-Hierarchical-Vein-Segment
下载链接
链接失效反馈
官方服务:
资源简介:
HALVS数据集是首个公开的层次化叶脉分割数据集,由武汉理工大学和上海人工智能实验室合作创建。该数据集包含5057张来自大豆、甜樱桃和伦敦梧桐三个物种的真实扫描高分辨率叶图像,每张图像均有人工标注的三级叶脉结构,总标注工作量达83.8人天。数据集的创建旨在通过层次化叶脉分割技术,帮助植物育种,提高植物的产量和质量,同时支持联合国可持续发展目标。

The HALVS Dataset is the first publicly available hierarchical leaf vein segmentation dataset, co-developed by Wuhan University of Technology and Shanghai AI Laboratory. This dataset contains 5057 high-resolution real scanned leaf images from three plant species: soybean, sweet cherry, and London plane. Each image has manually annotated three-level vein structures, with a total annotation workload of 83.8 person-days. The dataset is designed to facilitate plant breeding, improve crop yield and quality via hierarchical leaf vein segmentation technology, and support the United Nations Sustainable Development Goals.
提供机构:
武汉理工大学, 上海人工智能实验室
创建时间:
2024-05-16
搜集汇总
数据集介绍
main_image_url
构建方式
在植物表型学领域,获取高质量的叶片脉序图像一直面临挑战。HALVS数据集采用透射扫描技术,利用平板扫描仪在透射模式下采集叶片图像,该方法无需化学处理即可获得高分辨率、高对比度的脉序细节。数据集涵盖大豆、甜樱桃和伦敦悬铃木三种代表性物种,共计5,057张叶片图像。通过人工精细标注,对每张图像中的一级、二级和三级叶脉进行像素级标注,整个标注过程耗时约83.8人日,确保了标注的准确性和生物学合理性。
特点
HALVS数据集作为首个公开的层次化叶脉分割数据集,其核心特点在于提供了三级叶脉的精细语义标注。数据集图像分辨率高达4800×6000像素,清晰呈现了叶脉的微观结构。标注数据涵盖了不同物种的脉序形态差异,为跨物种学习研究提供了基础。与现有叶脉数据集相比,HALVS在图像质量、标注完整性和层次化标注方面具有显著优势,特别是三级叶脉的标注填补了该领域的数据空白。数据集还包含了部分标注数据,为标签高效学习范式的研究创造了条件。
使用方法
该数据集主要应用于计算机视觉和植物科学的交叉研究领域。研究人员可将高分辨率叶片图像裁剪为256×256像素的图块进行模型训练。数据集支持全监督、半监督和部分监督等多种学习范式,特别适用于标签稀缺场景下的算法开发。在实验设计中,可采用DeepLabv3+等语义分割架构,结合FixMatch、U2PL等半监督学习方法。数据集还支持跨物种迁移学习研究,通过源物种训练模型并评估在目标物种上的泛化能力,为植物表型分析提供新的研究视角。
背景与挑战
背景概述
在植物表型组学与计算机视觉交叉领域,叶片脉序的层级结构分析对于理解光合作用、蒸腾作用等关键生理功能至关重要,并直接关联高产量、高品质作物的育种研究。然而,传统图像处理方法难以从高度密集的脉序网络中提取丰富的语义信息,且公开数据集中普遍缺乏对脉序层级的精细标注。为填补这一空白,武汉理工大学与上海人工智能实验室的研究团队于2024年共同构建并发布了首个公开的层级叶片脉序分割数据集——HALVS。该数据集包含来自大豆、甜樱桃和悬铃木的5,057张高分辨率叶片扫描图像,并提供了总计耗费83.8人日标注的一级、二级和三级叶脉像素级真值,为基于深度学习的植物表型分析建立了重要基准。
当前挑战
HALVS数据集旨在解决的领域核心挑战是实现叶片脉序网络的层级语义分割,即不仅需将脉序从叶片背景中分离,还需精确区分不同层级(如一级、二级、三级)的脉序类别。这一任务因不同层级脉序在颜色、纹理上的高度相似性以及脉序结构的极端复杂性而尤为困难。在数据集构建过程中,主要挑战体现在两方面:一是高质量数据获取,需在不使用耗时且易损伤叶片的化学处理前提下,通过透射扫描技术获取高对比度脉序图像;二是标注工作面临巨大困难,尤其是三级叶脉的标注极为耗时且需要专业知识,例如标注单张悬铃木叶片的三级脉序平均需时约7.8小时,这导致了标注数据的严重稀缺性。
常用场景
经典使用场景
在植物表型组学和计算机视觉交叉领域,HALVS数据集为层级叶片脉络分割任务提供了首个公开基准。该数据集通过高分辨率扫描图像和精细的人工标注,精确区分了叶片中的一级、二级和三级叶脉,为开发能够理解植物叶片复杂脉序结构的深度学习模型奠定了数据基础。其经典使用场景在于训练和评估半监督或部分监督学习算法,以应对叶脉标注成本高昂的挑战,推动植物形态自动分析技术的发展。
解决学术问题
HALVS数据集有效解决了植物科学中叶片脉序结构定量分析的瓶颈问题。传统方法难以自动化区分不同层级的叶脉,且缺乏公开的精细标注数据。该数据集通过提供大规模、多物种、具有层级标注的高质量图像,使得研究人员能够系统研究叶脉网络的拓扑结构与生理功能关联,为理解叶片在光合作用、水分运输等过程中的作用提供了关键数据支撑,并促进了标签高效学习范式在农业科学中的首次应用探索。
衍生相关工作
围绕HALVS数据集,研究者已开展多项前沿探索。其配套提出的部分监督语义分割模块,创新性地整合了完全标注、部分标注与未标注数据,为标签稀缺场景下的视觉任务提供了新范式。相关工作进一步拓展至跨物种迁移学习研究,首次系统探讨了基于大豆叶脉数据模型向其他物种泛化的能力与挑战。这些工作不仅深化了对植物图像分析的认识,也为医学影像等标注成本高昂领域的算法研究提供了可借鉴的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作