five

LivingOptics/hyperspectral-grapes

收藏
Hugging Face2025-08-08 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/LivingOptics/hyperspectral-grapes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含300个白葡萄的高光谱反射光谱数据和每个葡萄的糖分含量值。数据通过使用Living Optics相机收集,旨在通过非接触方式估算葡萄的糖分含量。

The dataset contains 300 processed diffuse reflectance spectra of white grapes collected with the Living Optics camera, along with paired sugar content values for each grape. The data is intended for non-contact sugar estimation in grapes using hyperspectral data.
提供机构:
LivingOptics
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Living Optics团队构建,旨在利用高光谱成像技术实现葡萄糖度的非接触式估测。研究从六箱白葡萄(Agrimessina,意大利)中提取300颗个体葡萄,采用定制照明装置和Living Optics相机进行成像。相机以向下俯视的三脚架固定,实现45/0°成像几何,每轮将12颗葡萄样本置于黑色PLA托盘上,并采集Tyvek白板作为参考。使用18 mm物镜焦距,每颗葡萄平均获取约150个采样点。成像后,每颗葡萄提取3-4滴汁液(约0.2 ml),通过手持BRIX折射仪(AS-Q6,Aicevoos,中国)测量糖度值,仪器误差为±0.2 °Bx。最终数据集包含300个经处理的漫反射光谱及对应的糖度标签。
特点
该数据集的核心特点在于其高光谱成像技术与精准农业需求的紧密结合。数据涵盖300颗白葡萄的漫反射光谱,光谱信息丰富,能够捕捉葡萄内部化学成分的细微差异。每颗葡萄的糖度值通过实验室级折射仪精确测定,为监督学习提供了可靠的标注。数据集采用非破坏性采集方式,避免了传统湿化学方法的耗时与样本破坏问题,适用于高通量分析。此外,成像过程中的标准化几何配置和白板参考确保了光谱数据的可重复性和一致性,为构建稳健的糖度预测模型奠定了坚实基础。
使用方法
该数据集适用于训练回归模型以估测葡萄糖度,推荐采用偏最小二乘回归分析等统计建模技术。用户可通过Living Optics云门户下载数据集,其中包含300个光谱文件及对应的糖度值。使用前需对光谱数据进行预处理,如归一化、去噪或基线校正,以提升模型性能。建议将数据集划分为训练集和测试集,例如按80/20比例,并采用交叉验证优化模型参数。模型训练完成后,可应用于新采集的高光谱图像,实现葡萄糖度的快速、非破坏性预测,助力精准葡萄栽培和适应性收获决策。
背景与挑战
背景概述
在精准农业与葡萄酒酿造领域,葡萄成熟度的精确评估是决定最终酒品质量的核心环节。传统上,糖度(以总可溶性固形物或白利度衡量)、酸度及酚类物质等关键参数需通过湿化学分析法进行破坏性检测,这一过程不仅耗时耗力,且对样本造成不可逆损伤。针对这一痛点,Living Optics研究团队于近年开发了基于高光谱成像的非接触式糖度估算数据集,该数据集由300颗白葡萄个体的漫反射光谱与对应糖度值构成,旨在利用光谱信息与统计建模(如偏最小二乘回归)实现葡萄参数的快速无损预测。Living Optics作为高光谱相机制造商,致力于将这一技术推向大众市场,其数据集为农业传感器与计算机视觉的交叉研究提供了标准化基准,显著推动了精准葡萄栽培与自适应采收策略的发展。
当前挑战
该数据集面临的核心挑战在于领域问题的复杂性与构建过程的局限性。首先,葡萄成熟度预测涉及糖度、酸度、酚类等多维参数的同步估计,而现有数据集仅聚焦于糖度单一指标,难以全面反映果实生理状态;其次,高光谱数据易受光照条件、果实形态及品种差异影响,模型泛化能力受限。在构建过程中,样本采集仅涵盖单一批次的白葡萄品种(Agrimessina, Italy),且实验采用定制照明装置与固定成像几何,缺乏田间环境下的多变量验证;此外,糖度参考值依赖手持折射仪测量(误差±0.2°Bx),其精度与实验室标准方法存在差距,可能引入标签噪声。这些因素共同制约了数据集在真实农业场景中的直接应用与跨品种迁移能力。
常用场景
经典使用场景
在精准农业与葡萄酒酿造领域,葡萄浆果的成熟度监测是决定最终酒品品质的核心环节。该数据集利用高光谱成像技术,以非接触方式采集白葡萄的漫反射光谱数据,并配对精确的糖度值(以Brix度量),为建立光谱-糖分预测模型提供了高质量的基准数据。其经典使用场景聚焦于训练基于偏最小二乘回归(PLSR)等统计学习方法的回归器,实现对单个葡萄果实糖含量的无损、高通量估算,从而替代传统破坏性的湿化学分析法。
实际应用
在实际生产中,该数据集支撑着精准葡萄栽培与自适应采收策略的落地。酿酒商可利用基于该数据训练的光谱模型,在田间实时扫描葡萄串,快速获取糖度分布图,从而精确判断最佳采收窗口,避免因早采或晚采导致的品质损失。此外,该技术可集成到无人机或移动式高光谱成像系统中,实现大面积葡萄园的无人化巡检与成熟度分级,降低人力与试剂成本,提升葡萄酒产业的标准化与智能化水平。
衍生相关工作
围绕该数据集,已衍生出多项推动农业人工智能发展的经典工作。例如,研究者利用该数据开发了基于深度神经网络或集成学习的高光谱回归模型,进一步提升糖度预测的泛化能力;也有工作探索了光谱预处理算法(如标准正态变量变换、多元散射校正)对模型鲁棒性的影响。此外,该数据集被用作基准,比较不同降维技术(如主成分分析、自动编码器)在保留关键光谱特征方面的效能,为后续多品种、多成熟度葡萄数据集的设计提供了方法论参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作