five

花生根微根管图像数据集和柳枝稷根微根管图像数据集

收藏
arXiv2020-04-24 更新2024-06-21 收录
下载链接:
https://github.com/GatorSense/PlantRootSeg
下载链接
链接失效反馈
官方服务:
资源简介:
本研究构建了两个微根管根图像数据集:一个包含17,550张花生根RGB图像,另一个包含28张柳枝稷根RGB图像。两个数据集均配有人工标注的地面实况掩码,用于指示每张图像中根的位置。花生根数据集在2016年生长季节在佛罗里达州Citra的植物科学研究与教育单位(PSREU)的田间试验中收集。柳枝稷根数据集使用CI-602 insitu根成像仪在伊利诺伊州Batavia的费米实验室国家环境研究公园的一个两年生柳枝稷田中收集。这些数据集用于研究转移学习技术在有限数据集上的应用,特别是在植物根系分割任务中,旨在提高数据收集和后处理的效率,解决全球粮食、资源和气候问题。

This study constructed two minirhizotron root image datasets: one containing 17,550 RGB images of peanut roots, and the other containing 28 RGB images of switchgrass roots. Both datasets are paired with manually annotated ground truth masks that indicate the positions of roots in each image. The peanut root dataset was collected during the 2016 growing season from a field experiment conducted at the Plant Science Research and Education Unit (PSREU) in Citra, Florida, USA. The switchgrass root dataset was collected using a CI-602 in-situ root imager from a two-year-old switchgrass field at the Fermilab National Environmental Research Park in Batavia, Illinois, USA. These datasets are used to study the application of transfer learning techniques on limited datasets, particularly in plant root segmentation tasks, aiming to improve the efficiency of data collection and post-processing, and address global food, resource, and climate issues.
提供机构:
佛罗里达大学电气与计算机工程系
创建时间:
2019-03-22
搜集汇总
数据集介绍
main_image_url
构建方式
在植物根系表型研究领域,微根管成像技术为原位监测根系动态提供了关键手段。该数据集的构建依托于规范的田间试验流程:花生根系数据集采集于佛罗里达州田间试验站,通过安装于土壤中的微根管,使用BTC 100X摄像系统以特定分辨率沿管壁捕捉图像,并借助WinRHIZO Tron软件手动绘制矩形区域生成二进制掩码标签。柳枝稷根系数据集则在美国费米实验室采集,采用CID BioScience原位根成像仪获取图像,并创新性地应用简单线性迭代聚类算法将图像预处理为超像素,在此基础上进行人工标注,显著提升了标注效率。两个数据集均严格配对原始RGB图像与像素级真实掩码。
特点
该数据集的核心特点体现在其规模差异与标注方法的互补性上。花生根系数据集规模较大,包含17,550张图像,为模型训练提供了相对丰富的样本;而柳枝稷数据集虽仅含28张图像,但其图像分辨率更高,且通过超像素级标注实现了更精细的边界刻画。尤为重要的是,数据集的标注过程揭示了人工方法的固有局限,如WinRHIZO软件产生的固定宽度矩形标注会引入与实际根系直径不符的误差,这反而为评估算法校正人工误差的能力提供了独特基准。这种规模与质量的组合,使其成为研究小样本迁移学习的理想测试平台。
使用方法
该数据集的主要应用方向是驱动基于深度学习的植物根系像素级语义分割研究。典型使用流程是,首先利用大规模花生数据集从头训练U-Net等编码器-解码器架构网络,获取根系分割的基础模型并评估不同网络深度的影响。随后,将训练好的模型权重作为预训练特征,迁移至小规模的柳枝稷数据集上进行微调,以此探究领域相关预训练数据相较于大规模通用数据(如ImageNet)的有效性。研究证实,即使预训练数据集规模有限,但其与目标任务的强相关性能够带来更优的分割精度、更快的收敛速度及更稳定的性能,这为小样本植物图像分析提供了切实可行的技术路径。
背景与挑战
背景概述
微根管技术作为植物根系生长监测的关键手段,其图像分析长期依赖人工标注,效率低下且易出错。为应对这一挑战,由美国佛罗里达大学、密西西比州立大学等多所研究机构联合构建的花生根微根管图像数据集与柳枝稷根微根管图像数据集于2020年正式发布,旨在通过深度学习技术实现根系像素级自动分割。该研究聚焦于植物表型组学领域,核心在于解决根系图像语义分割中训练数据稀缺的瓶颈,通过迁移学习策略,探索相关但规模适中的预训练特征对小型目标数据集的增强效果,为高通量根系性状分析提供了重要数据基础,推动了植物根系自动化研究的发展。
当前挑战
该数据集面临的挑战主要体现在两方面:其一,在领域问题层面,微根管图像中根系与土壤背景的语义分割任务极具复杂性,根系形态多样、背景噪声干扰(如水泡、反射等)以及像素级标注需求使得传统方法难以实现高精度自动化分析;其二,在构建过程中,数据标注依赖人工手动完成,耗时耗力且易引入误差(如标注矩形宽度固定导致的根系直径失真),同时柳枝稷数据集规模极小(仅28张图像),严重限制了深度学习模型的直接训练,凸显了小样本条件下模型泛化与过拟合的严峻挑战。
常用场景
经典使用场景
在植物根系表型研究领域,微根管图像数据集为深度学习模型提供了关键的训练与验证资源。该数据集最经典的使用场景在于训练U-net架构的卷积神经网络,实现根系与土壤背景的像素级语义分割。通过输入高分辨率的微根管RGB图像,模型能够自动输出精确的根系二值掩码,极大提升了根系形态参数提取的效率。这一过程通常涉及端到端的训练范式,利用编码器-解码器结构捕获多层次特征,并通过跳跃连接融合空间信息,最终生成与原始图像尺寸一致的分割结果。
解决学术问题
该数据集有效解决了植物科学中根系图像分析的核心瓶颈问题。传统人工标注微根管图像极为耗时且易出错,限制了大规模实验的数据通量。通过提供大量带有精准标注的根系图像,该数据集使研究人员能够开发自动化分割算法,显著减少了人工干预。其更深层的学术意义在于,它验证了迁移学习在小样本植物图像分析中的有效性,特别是证明了领域相关的中等规模数据集(如花生根系)的预训练特征,相较于大规模但不相关的ImageNet数据集,能更高效地提升目标小数据集(如柳枝稷根系)的分割性能,为跨物种根系研究提供了方法论基础。
衍生相关工作
该数据集的发布催生了一系列围绕植物根系图像分析的经典研究工作。其核心贡献在于推动了迁移学习策略在植物表型领域的深入应用,后续研究多借鉴其“领域相关预训练”范式,探索不同作物间的特征迁移能力。基于该数据集训练的U-net模型架构也被广泛采纳和优化,衍生出如结合VGG编码器的改进网络。此外,该工作启发了对预训练特征通用性的重新思考,促使学界更关注中等规模、高相关性数据集的构建价值,而非盲目依赖超大规模通用数据集,为小样本学习在农业视觉领域的实践奠定了重要基石。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务