大麦发芽过程的时间序列数据集
收藏arXiv2025-04-23 更新2025-04-25 收录
下载链接:
https://dx.doi.org/10.5281/zenodo.6724225
下载链接
链接失效反馈官方服务:
资源简介:
本研究提供了一个开源的时间序列数据集,包含RGB和近红外(NIR)光谱图像以及与之相关的分割掩模。该数据集由丹麦哥本哈根大学等机构创建,包含2242个大麦籽粒的图像,这些籽粒在暴露于水分前后每隔24小时被成像一次,持续五天。数据集涵盖了四个不同品种的大麦:两个品种为Prospect,两个品种为Laureate。数据集旨在帮助研究大麦籽粒的发芽过程,可用于图像分析和光谱分析。数据集在遵循CC BY-NC 4.0许可的前提下,可通过哥本哈根大学的电子研究数据档案免费下载。
This study presents an open-source time-series dataset comprising RGB and near-infrared (NIR) spectral images along with their corresponding segmentation masks. Developed by institutions including the University of Copenhagen in Denmark, this dataset includes images of 2242 individual barley grains. These grains were imaged every 24 hours over five consecutive days, both prior to and following exposure to moisture. The dataset encompasses four distinct barley cultivars: two varieties of Prospect and two of Laureate. Its primary purpose is to support research into the germination process of barley grains, and it is applicable for both image analysis and spectral analysis applications. The dataset is freely downloadable through the Electronic Research Data Archive at the University of Copenhagen, under the terms of the CC BY-NC 4.0 license.
提供机构:
丹麦哥本哈根大学计算机科学系、丹麦食品科学系、丹麦大学学院Lillebælt、丹麦自然历史博物馆
创建时间:
2025-04-23
搜集汇总
数据集介绍

构建方式
该数据集通过精密的实验设计构建,采用两种大麦品种(Prospect和Laureate)的2242颗籽粒作为研究对象。每颗籽粒在水分暴露前及连续五天每隔24小时进行同步RGB相机和近红外高光谱成像(NIR-HSI)采集,共六次成像。实验使用黑色滤纸背景配合聚合物网格固定籽粒位置,通过Otsu阈值法和连通域分析生成分割掩膜,并计算平均伪吸光度光谱。数据采集系统包含卤素光源照明、Basler Ace 2 Pro RGB相机和Specim FX17高光谱相机,确保多模态数据时空对齐。
使用方法
研究者可利用该数据集开发基于计算机视觉或光谱分析的籽粒发芽预测模型。典型应用包括:通过RGB图像序列分析芽体形态演变,基于NIR-HSI数据建立发芽早期光谱特征库,或融合多模态数据构建时间分类器。配套提供的网格坐标和分割掩膜支持端到端分析流程,而仿射变换参数允许跨时间点追踪单颗籽粒。需注意因胶水抑制导致的发芽率偏差,在模型迁移至正常培育环境时需进行偏差校正。数据集遵循CC BY-NC 4.0协议,包含完整的图像采集标准化流程文档。
背景与挑战
背景概述
大麦发芽过程的时间序列数据集由丹麦哥本哈根大学与FOSS Analytical A/S等机构联合开发,于2025年4月正式发布。该数据集聚焦于农业科学中的种子发芽监测领域,通过近红外高光谱成像(NIR-HSI)和RGB图像同步采集技术,记录了2242个大麦籽粒在湿度暴露前后连续五天的多模态时序数据。核心研究在于建立非破坏性发芽预测模型,为作物育种和食品工业提供精准的 germination time(发芽时间)量化指标。数据集创新性地整合了化学计量学与计算机视觉方法,其网格追踪设计和标准化采集流程显著提升了农业表型组学研究的可重复性。
当前挑战
该数据集面临双重挑战:在领域问题层面,需解决近红外光谱与可见光图像在多时相分析中的特征融合难题,以及发芽早期微弱生物标记的跨模态检测灵敏度问题。构建过程中,实验设计受到3D打印网格残留胶水的意外干扰,导致发芽抑制偏差;技术层面需克服高光谱数据零反射值的传感器故障修复、多时相籽粒追踪的仿射变换精度控制,以及潮湿滤纸反光对分割算法的干扰。此外,12bit高光谱数据的存储优化与uint16分析兼容性也构成工程挑战。
常用场景
经典使用场景
大麦发芽过程的时间序列数据集在农业科学和计算机视觉领域具有广泛的应用价值。该数据集通过RGB和近红外高光谱成像(NIR-HSI)技术,记录了大麦籽粒在发芽过程中的动态变化,为研究发芽机制提供了丰富的多模态数据。其经典使用场景包括发芽时间预测、发芽率评估以及发芽过程中生理变化的可视化分析。
解决学术问题
该数据集解决了农业科学中关于大麦发芽过程的多个关键学术问题。通过高时间分辨率的图像和光谱数据,研究人员能够精确量化发芽动力学,揭示环境因素(如水分和温度)对发芽率的影响。此外,数据集支持机器学习模型的开发,用于分类发芽与非发芽籽粒,为种子质量评估提供了新的技术手段。
实际应用
在实际应用中,该数据集为农业育种和食品工业提供了重要支持。例如,酿酒行业可通过分析大麦发芽数据优化麦芽生产流程,提高产品质量和一致性。此外,种子公司可利用该数据集开发自动化检测系统,快速筛选高发芽率的种子批次,从而降低生产成本并提高农业效率。
数据集最近研究
最新研究方向
近年来,大麦发芽过程的时间序列数据集在农业科学和计算机视觉领域引起了广泛关注。该数据集结合了近红外光谱(NIR)和高光谱成像(NIR-HSI)技术,为研究大麦发芽的动态过程提供了多模态数据支持。前沿研究主要集中在利用深度学习模型分析时间序列图像数据,以预测发芽率和发芽时间,同时探索多模态数据融合技术在农作物品质评估中的应用。此外,该数据集还被用于开发高效的图像分割算法,以区分发芽和未发芽的籽粒,为精准农业和自动化种子筛选提供了重要工具。数据集的开源性进一步促进了跨学科合作,推动了农业智能化和计算机视觉技术的融合发展。
相关研究论文
- 1A Time Series Dataset of NIR Spectra and RGB and NIR-HSI Images of the Barley Germination Process丹麦哥本哈根大学计算机科学系、丹麦食品科学系、丹麦大学学院Lillebælt、丹麦自然历史博物馆 · 2025年
以上内容由遇见数据集搜集并总结生成



