RiceSEG
收藏arXiv2025-04-02 更新2025-04-08 收录
下载链接:
https://www.global-rice.com/
下载链接
链接失效反馈官方服务:
资源简介:
RiceSEG是一个全面的、多样化的高分辨率RGB标注图像数据集,包含来自五个主要水稻种植国家(中国、日本、印度、菲律宾、坦桑尼亚)的近5万张地面图像,涵盖6000多个品种的水稻生长周期。数据集从原始图像中选取3078个代表性样本,并标注为六个类别(背景、绿色植被、衰老植被、稻穗、杂草、浮萍)。该数据集是公开的,旨在促进水稻分割算法的开发和评估。
RiceSEG is a comprehensive and diverse high-resolution RGB annotated image dataset. It contains nearly 50,000 ground-level images collected from five major rice-growing countries, namely China, Japan, India, the Philippines, and Tanzania, covering the growth cycles of over 6,000 rice varieties. A total of 3,078 representative samples were selected from the original images and annotated into six categories: background, green vegetation, senescent vegetation, rice panicles, weeds, and duckweed. This publicly available dataset aims to facilitate the development and evaluation of rice segmentation algorithms.
提供机构:
南京农业大学
创建时间:
2025-04-02
搜集汇总
数据集介绍

构建方式
RiceSEG数据集构建过程体现了高度的科学严谨性与全球协作精神。研究团队从中国、日本、印度、菲律宾和坦桑尼亚五大水稻主产国收集了近50,000张高分辨率地面图像,覆盖6,000余种基因型和完整生长周期。通过多阶段筛选策略,最终精选3,078张代表性样本,采用超像素标注工具进行六类精细标注(背景、绿色植被、衰老植被、稻穗、杂草和浮萍)。中国子集特别涵盖从东北至南方所有主要基因型和种植环境,图像经中心裁剪统一为512×512像素规格,确保数据质量与标注一致性的平衡。
使用方法
该数据集支持端到端的深度学习模型开发与评估,研究者可采用8:2比例划分训练测试集。基准测试表明Transformer架构(如Mask2Former)在复杂类别分割上显著优于传统CNN模型,尤其在稻穗识别(IoU 74.69)和杂草区分等挑战性任务中。除像素级评估指标(mIoU/mAcc)外,数据集特别支持图像级性状解析,如通过绿色植被比例推算叶面积指数。为提升模型泛化性,建议结合迁移学习策略处理国家间数据分布差异,并采用类别加权损失函数平衡样本不均衡问题。数据集官网提供标准化数据接口和基线模型代码,加速农业计算机视觉研究进程。
背景与挑战
背景概述
RiceSEG数据集由南京农业大学、东京大学等12家机构联合构建,旨在为水稻表型研究提供高质量的多类别语义分割数据。该数据集创建于2024年,收录了来自中国、日本、印度等五大水稻主产国的3078张高分辨率田间图像,涵盖6000余种基因型和完整生育期。作为首个整合器官尺度(绿叶、衰老叶、穗)与杂草类别的稻作数据集,其创新性地解决了传统单类别分割在源库关系研究和杂草识别中的局限性。通过覆盖从寒地粳稻到热带籼稻的生态多样性,该数据集为开发具有跨区域适应性的智能农业算法奠定了重要基础。
当前挑战
在领域问题层面,水稻冠层复杂的形态特征(细长叶片、薄茎秆)和田间多变的光照条件(相互遮荫、水面反光)导致现有模型在生殖期多器官分割中的平均交并比(mIoU)仅为74.69%。构建过程中,细粒度标注面临三大挑战:衰老叶片与阴影区域的视觉混淆需三重人工校验;42.9%的图像存在杂草与水稻形态相似性问题;超像素标注工具需动态调整分辨率以平衡0.1mm/pixel的器官边界精度与标注效率。此外,数据分布不均衡问题突出,衰老植被标注占比仅2.5%,制约了模型对小目标类别的识别性能。
常用场景
经典使用场景
在精准农业和作物表型研究中,RiceSEG数据集为多类别水稻语义分割算法的开发与评估提供了关键支持。该数据集包含来自五个主要水稻种植国家的3078张高分辨率RGB图像,涵盖6000多个基因型和所有生长阶段,特别适用于训练和测试深度学习模型在复杂田间条件下的分割性能。其精细标注的六个类别(背景、绿色植被、衰老植被、穗、杂草和浮萍)为研究水稻器官动态发育及杂草竞争机制提供了数据基础。
解决学术问题
RiceSEG有效解决了农业计算机视觉领域三个核心问题:一是填补了多类别水稻语义分割数据集的空白,克服了传统单类别分割对器官互作研究的局限;二是通过覆盖全球多样化的基因型-环境组合,提升了模型在跨区域应用中的泛化能力;三是以像素级标注量化了冠层内源-库器官比例,为光合产物分配等生理过程研究提供了新范式。该数据集显著推动了从表型到基因型的关联分析精度。
实际应用
在实际农业场景中,RiceSEG支撑的算法已应用于:1) 无人机田间巡检系统,通过实时分割穗部实现产量预测;2) 智能除草机器人,准确区分水稻与杂草提升除草剂靶向性;3) 数字化育种平台,量化不同基因型器官发育动态。日本东京大学利用该数据集开发的冠层分析系统,将传统人工测量效率提升20倍,在中国东北寒地稻作区验证了模型在低温胁迫表型分析中的可靠性。
数据集最近研究
最新研究方向
近年来,RiceSEG数据集在农业计算机视觉领域引起了广泛关注,特别是在水稻表型分析和精准农业方面。该数据集通过提供高分辨率的多类别语义分割标注,为开发先进的深度学习模型提供了重要基础。前沿研究方向主要集中在利用Transformer架构优化水稻器官的精细分割,尤其是在生殖阶段复杂的冠层结构下提升模型性能。此外,结合多光谱和三维重建技术,进一步提升模型在复杂光照和反射条件下的鲁棒性,成为当前研究的热点。RiceSEG的多样性和全球覆盖范围使其在推动智能农业和作物育种方面具有重要影响,为全球粮食安全提供了技术支持。
相关研究论文
- 1Global Rice Multi-Class Segmentation Dataset (RiceSEG): A Comprehensive and Diverse High-Resolution RGB-Annotated Images for the Development and Benchmarking of Rice Segmentation Algorithms南京农业大学 · 2025年
以上内容由遇见数据集搜集并总结生成



