five

RaspGrade

收藏
arXiv2025-05-14 更新2025-05-15 收录
下载链接:
https://huggingface.co/datasets/FBK-TeV/RaspGrade
下载链接
链接失效反馈
官方服务:
资源简介:
RaspGrade数据集由意大利的Fondazione Bruno Kessler和Sant’Orsola组织创建,旨在为工业环境中实时评估树莓成熟度提供数据支持。该数据集包含5243个树莓样本,每个样本都有像素级别的分割掩码和成熟度等级标签,涵盖了从未成熟到过熟的五个不同成熟度等级。数据集通过Hugging Face平台公开,为研究自动水果分级提供了宝贵的资源。

The RaspGrade dataset was created by Fondazione Bruno Kessler and Sant’Orsola in Italy, aiming to provide data support for real-time raspberry maturity evaluation in industrial environments. This dataset comprises 5243 raspberry samples, each with pixel-level segmentation masks and maturity level labels, covering five distinct maturity levels ranging from immature to overripe. The dataset is publicly available via the Hugging Face platform, serving as a valuable resource for research on automatic fruit grading.
提供机构:
Fondazione Bruno Kessler, Trento, Italy
创建时间:
2025-05-13
原始信息汇总

RaspGrade 数据集概述

基本信息

  • 许可证: CC-BY-NC-4.0
  • 任务类别: 图像分割
  • 标签: 食品、食品质量
  • 数据集名称: RaspGrade
  • 数据集大小: 260906614 字节
  • 下载大小: 242513653 字节
  • 规模分类: 1K < n < 10K

数据集结构

特征

  • image: 图像数据(dtype: image)
  • labels: 序列化的浮点数(dtype: sequence of float64)
  • image_id: 字符串标识符(dtype: string)

数据划分

  • 训练集 (train)
    • 样本数量: 160
    • 数据大小: 208837995 字节
  • 验证集 (valid)
    • 样本数量: 40
    • 数据大小: 52068619 字节

研究背景

  • 研究目标: 应用计算机视觉技术实现快速、准确、非侵入式的食品质量评估,专注于工业环境中实时将树莓分级为五个不同类别的挑战。
  • 数据集用途: 用于树莓成熟度自动分级的深度学习研究。

数据集特点

  • 标注格式: 遵循 YOLO 实例分割格式。
  • 挑战: 某些树莓等级由于颜色相似和遮挡而难以分类,而其他等级则更容易通过颜色区分。

相关资源

  • 论文链接: https://arxiv.org/html/2505.08537v1
  • 数据集链接: https://huggingface.co/datasets/FBK-TeV/RaspGrade

致谢

  • 支持机构: 欧盟 Horizon Europe 研究创新计划(项目编号 101092043,项目名称 AGILEHAND)。

合作伙伴

  • FBK
  • Santorsola

引用

bibtex @article{riz2024wild, title={The RaspGrade Dataset: Towards Automatic Raspberry Ripeness Grading with Deep Learning}, author={Mekhalfi, Mohamed Lamine and Chippendale, Paul and Poiesi, Fabio and Bonecher, Samuele and Osler, Gilberto and Zancanella, Nicola }, journal={arXiv preprint arXiv::2505.08537v1}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
在农业智能化快速发展的背景下,RaspGrade数据集的构建采用了工业级图像采集系统。研究团队使用Intel® RealSense™ D456传感器配合垂直支架,以1280×800分辨率捕捉传送带上覆盆子的俯视图像,并采用WÜRTH专业LED照明系统消除环境光干扰。通过CVAT标注工具,由Sant’Orsola公司的专业质检员对5243颗覆盆子进行像素级实例分割标注,按成熟度划分为OK(Grade 1)、Dark(Grade 2)等五个等级,最终形成包含200组包装盒的标准化数据集。
特点
该数据集的核心价值在于其工业场景适配性,覆盖了覆盆子分级中最具挑战性的颜色相似性与遮挡问题。相较于传统野外采摘数据集,其独特之处在于:1)包含20%测试集的严格比例划分,确保模型验证可靠性;2)标注粒度达到单果像素级,提供精确的实例分割基准;3)特别标注的包装盒(Punnet)数据为工业分拣系统开发提供空间参考。值得注意的是,Grade 2样本占比达68.7%,而Grade 4仅1.2%,这种非均衡分布真实反映了工业生产中的果实成熟度比例。
使用方法
作为首个覆盆子成熟度分级基准数据集,RaspGrade支持计算机视觉与农业技术的交叉研究。使用者可通过HuggingFace平台获取经标准化的图像与标注文件,配套的YOLOv8基线模型实现62.2%的mAP50验证精度。针对工业应用场景,建议重点优化Grade 5(Waste)类别的检测,该类别因表面损伤的多样性在实验中仅获9.3%精度。研究显示,调整分类损失权重至7可显著提升整体性能至65.5%,这为后续研究提供了重要调参方向。数据集同时适用于迁移学习研究,尤其在少量样本条件下提升模型对浅色果实(Grade 3)的识别能力。
背景与挑战
背景概述
RaspGrade数据集由意大利Fondazione Bruno Kessler研究所与Sant’Orsola公司于2025年联合创建,旨在解决工业环境下树莓成熟度自动分级的核心问题。作为首个专注于树莓五级分段的公开数据集,其通过RGB图像采集与像素级标注,填补了小型浆果在实时分选领域的研究空白。该数据集包含5243个实例的精细标注,覆盖OK、Dark、Light、Second和Waste五个成熟度等级,为农业自动化中的视觉检测技术提供了重要基准,推动了计算机视觉在精密农业中的应用边界。
当前挑战
该数据集面临双重技术挑战:在领域问题层面,树莓间颜色相似性导致成熟度分类困难,特别是Grade 3至5的区分准确率仅为53.6%-23.7%;工业场景中的实时检测要求与果实遮挡、运动模糊等干扰形成矛盾。在构建过程中,小尺寸果实(平均直径1.5cm)的像素级标注精度、多角度采集导致的特征变异,以及少数类别样本不足(如Grade 4仅62个样本)等问题,显著增加了数据标注与模型训练的复杂度。
常用场景
经典使用场景
RaspGrade数据集在农业智能化领域展现了其独特的价值,特别是在浆果成熟度自动分级任务中。该数据集通过高分辨率RGB图像和像素级标注,为深度学习模型提供了丰富的训练素材。在工业级传送带场景下,研究人员利用该数据集开发了基于YOLOv8的实例分割系统,实现了对覆盆子五种成熟度等级的实时分类。这一应用场景充分体现了数据集在复杂工业环境中的实用性,其中光照变化、果实遮挡和小尺寸目标等挑战性因素得到了系统性的解决。
衍生相关工作
该数据集的发布催生了多个具有影响力的衍生研究。在算法层面,研究者基于RaspGrade开发了改进的注意力机制网络,有效提升了小目标分割精度。应用扩展方面,有团队将其迁移至草莓、蓝莓等小型水果的缺陷检测任务。数据集还启发了多模态传感系统的研发,如结合近红外光谱的成熟度预测模型。这些工作共同推动了农业机器视觉从实验室研究向产业化应用的转化,形成了一系列被IEEE Transactions等顶级期刊收录的创新成果。
数据集最近研究
最新研究方向
随着农业智能化进程的加速,RaspGrade数据集的推出为浆果成熟度自动分级领域注入了新的研究活力。该数据集聚焦于工业环境下树莓实时分级的计算机视觉挑战,通过精细标注的五级成熟度样本,填补了该细分领域公开数据的空白。当前研究热点集中在基于YOLOv8的实例分割模型优化,特别是针对颜色相近等级的分类瓶颈问题,学者们正探索损失函数加权、多模态数据融合等改进策略。在精准农业和食品工业4.0背景下,该数据集不仅推动了小浆果自动化检测技术的革新,其工业场景导向的设计思路更为农产品质量检测提供了可复用的研究范式,相关成果已开始应用于意大利领先浆果生产商Sant'Orsola的智能包装产线。
相关研究论文
  • 1
    The RaspGrade Dataset: Towards Automatic Raspberry Ripeness Grading with Deep LearningFondazione Bruno Kessler, Trento, Italy · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作