Image2Biomass Pasture Innovation Challenge
收藏arXiv2025-10-27 更新2025-11-05 收录
下载链接:
https://www.kaggle.com/competitions/csiro-biomass
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了从澳大利亚19个地点收集的1162张标注过的牧草俯视图,这些图像跨越多个季节,包括一系列温带牧草种类。每张图像捕捉了一个70cm × 30cm的正方形区域,并与地面测量数据配对,包括按成分分类的生物量(绿色、死亡和豆科植物分数)、植被高度以及来自主动光学传感器(AOS)的归一化植被指数(NDVI)。数据的多维特性结合了视觉、光谱和结构信息,为推进精准放牧管理技术的应用开辟了新的可能性。该数据集在Kaggle竞赛中发布和托管,挑战国际机器学习界进行牧草生物量估计的任务。
This dataset contains 1,162 labeled top-down images of pasture grass collected from 19 locations across Australia, spanning multiple growing seasons and encompassing a diverse array of temperate pasture species. Each image captures a 70 cm × 30 cm square area and is paired with ground-based measurements, including biomass categorized by component (green, dead, and legume fractions), vegetation height, and Normalized Difference Vegetation Index (NDVI) derived from an Active Optical Sensor (AOS). The multi-dimensional dataset combines visual, spectral, and structural information, creating new opportunities to advance the deployment of precision grazing management technologies. This dataset was published and hosted as part of a Kaggle competition, challenging the global machine learning community to address the task of pasture biomass estimation.
提供机构:
澳大利亚联邦科学与工业研究组织(CSIRO)
创建时间:
2025-10-27
搜集汇总
数据集介绍

构建方式
在精准农业背景下,该数据集通过系统化采集流程构建而成,涵盖澳大利亚19个地点的温带牧场生态系统。数据收集采用标准化70cm×30cm样方框架,结合多品牌消费级相机获取俯视图像,并同步记录植被高度、归一化植被指数等实地测量参数。实验室处理阶段通过48小时烘干与组分分离,精确量化绿色植被、枯死物质及三叶草的生物量干重,最终从3187个原始样本中筛选出1162个高质量数据点。
特点
该数据集凸显多模态融合优势,整合视觉图像、光谱指数与结构参数形成三维数据矩阵。其时空跨度覆盖四年周期与多元地理环境,包含六种主要牧草物种的季节性变化特征。独特之处在于提供植被组分的精细标注,突破传统总生物量估计的局限,支持牧草营养价值评估。数据采集设备涵盖从智能手机到专业相机的多样化器材,有效增强模型在真实场景中的泛化能力。
使用方法
该数据集通过Kaggle竞赛平台向机器学习社区开放,采用分层评估协议确保模型可靠性。训练阶段允许使用采样日期、地理位置等辅助元数据,而验证与测试集仅保留图像与生物量标签,模拟实际部署环境。评估体系采用对数变换稳定高动态范围数据,并以加权R²分数衡量五个生物量组分的预测精度,其中总生物量占比50%体现其核心地位。这种设计既促进视觉特征挖掘,又推动多任务学习等先进算法的发展。
背景与挑战
背景概述
精准农业领域对牧场生物量的高效估测需求日益迫切,传统方法如剪切称重虽准确但效率低下。Image2Biomass Pasture Innovation Challenge数据集由澳大利亚联邦科学与工业研究组织、谷歌及多所大学于2025年联合发布,聚焦于通过俯视图像实现牧场生物量的非破坏性智能估测。该数据集涵盖澳大利亚19个地点的1,162幅标注图像,整合了可见光、光谱与结构多维数据,显著推动了精准放牧管理技术的革新,为全球畜牧业可持续发展提供了关键数据支撑。
当前挑战
该数据集致力于解决牧场生物量估测中植被密度差异大、物种混合复杂及环境变异显著等核心难题。构建过程中面临多重挑战:野外数据采集需克服设备多样性导致的图像标准化困难,实验室组分分离需保证绿植、枯草与豆科植物的精确量化;同时,数据整合需协调多源异构信息,而地理与季节覆盖的广度对模型泛化能力提出了更高要求。
常用场景
经典使用场景
在精准农业领域,该数据集为计算机视觉模型提供了从俯视图像估算牧场生物量的标准化基准。通过整合视觉、光谱和结构信息,研究人员能够开发深度学习算法,以非破坏性方式精确量化绿色植被、枯死物质和三叶草等组分的干物质含量。这种多模态数据融合显著提升了模型在复杂牧场环境中的泛化能力,为自动化生物量监测奠定了技术基础。
解决学术问题
该数据集有效解决了传统生物量测量方法依赖人工采样、耗时耗力且难以规模化的学术瓶颈。通过提供实验室验证的多组分生物量标注,它支持机器学习模型突破NDVI光谱饱和、植被高度变异等经典难题。其跨季节、多地域的数据特性更推动了领域自适应、多任务学习等前沿方法在农业视觉中的探索,为建立可解释的生态参数反演模型提供关键支撑。
衍生相关工作
该数据集催生了多项创新研究,包括结合生成对抗网络的数据增强方法以解决样本不平衡问题,以及开发跨模态融合架构同步处理图像与NDVI光谱数据。相关成果进一步推动了无监督域适应技术在无人机影像与地面图像间的迁移应用,并为半监督学习在农业场景中的部署提供重要基准,持续拓展精准放牧管理的技术边界。
以上内容由遇见数据集搜集并总结生成



