SICKLE
收藏arXiv2023-11-30 更新2024-06-21 收录
下载链接:
https://sites.google.com/iiitd.ac.in/sickle/home
下载链接
链接失效反馈官方服务:
资源简介:
SICKLE是一个独特的多传感器卫星图像数据集,专注于农业领域,由印度德里的信息技术和信息学院与金奈的斯瓦米纳坦研究基金会合作创建。该数据集包含来自Landsat-8、Sentinel-1和Sentinel-2卫星的时间序列多分辨率图像,覆盖2018年1月至2021年3月,共计2,370个季节性样本,涉及388个独特地块,平均面积为0.38英亩,用于分类21种作物类型。数据集的创建过程涉及与农民的互动,收集关于作物类型、生长季节和产量的信息,并使用QGIS软件进行数据标注。SICKLE数据集的应用领域包括作物类型分类、作物物候期(播种、移栽和收获日期)预测和产量预测,旨在通过高分辨率卫星图像和详细农业参数的结合,提高农业决策的准确性和效率。
SICKLE is a unique multi-sensor satellite imagery dataset dedicated to the agricultural domain, developed in collaboration between the School of Information Technology and Informatics in Delhi, India and the Swaminathan Research Foundation based in Chennai.
This dataset contains time-series multi-resolution images from Landsat-8, Sentinel-1 and Sentinel-2 satellites, spanning from January 2018 to March 2021. It includes a total of 2,370 seasonal samples covering 388 unique agricultural parcels with an average area of 0.38 acres, and is intended for the classification of 21 crop types.
The development of the SICKLE dataset involved engaging with local farmers to gather information on crop types, growing seasons and yields, followed by data annotation conducted using QGIS software.
Application scenarios of the SICKLE dataset include crop type classification, crop phenology prediction (covering sowing, transplanting and harvesting dates) and yield prediction. It aims to improve the accuracy and efficiency of agricultural decision-making by combining high-resolution satellite imagery with detailed agricultural parameters.
提供机构:
印度德里的信息技术和信息学院,印度金奈的斯瓦米纳坦研究基金会
创建时间:
2023-11-30
搜集汇总
数据集介绍

构建方式
在农业遥感领域,高质量标注数据集的稀缺制约了机器学习模型的深度应用。SICKLE数据集的构建始于2018年1月至2021年3月期间,研究团队在印度泰米尔纳德邦的Cauvery Delta水稻种植区开展了系统的地面调查。通过对388个独立田块的农户进行访谈,收集了作物类型、品种、生长季持续时间及单位面积产量等关键农艺参数。卫星影像数据则通过Google Earth Engine平台获取,涵盖了Landsat-8、Sentinel-1和Sentinel-2三颗卫星的多光谱、热红外与微波传感器原始波段数据。基于区域标准生长季的领域知识,研究团队创新性地采用320米×320米缓冲区裁剪策略,而非传统的田块级裁剪,从而生成了包含2,370个季节样本的多分辨率时间序列数据集。
特点
SICKLE数据集的核心特征体现在其多维度的协同设计上。作为首个整合多卫星传感器与多农艺参数标注的遥感数据集,它同时提供光学、热红外和雷达三种模态的时序影像,覆盖30米、10米和3米三种空间分辨率。数据集包含21种作物类型分类标签,并对145个田块的351个水稻样本标注了品种、生长季及产量等精细参数。尤为突出的是,数据集首次系统收录了与作物物候密切相关的播种、移栽和收获日期,为物候学研究提供了直接观测依据。多分辨率标注机制使得该数据集能够支持从低分辨率影像生成高分辨率推断图的研究,而相同地理区域的多源卫星时序数据则为跨传感器融合与合成波段生成提供了理想实验平台。
使用方法
该数据集支持农业遥感领域的多种研究任务,其使用方式具有显著的灵活性与拓展性。在基础任务层面,研究者可利用其进行作物类型语义分割、物候日期预测和产量估算,其中物候与产量预测任务可建模为回归问题。数据集的多分辨率特性使其适用于图像超分辨率研究,而多传感器数据则支持早期融合、晚期融合等跨卫星融合方法的探索。对于多任务学习,由于相同田块集合拥有多重标注,可训练端到端的共享特征表示网络。在实际使用中,研究团队已提供基于U-Net 3D、ConvLSTM等架构的基准代码,并建议采用分层分割策略确保训练、验证与测试集在关键参数分布上的平衡。数据集的目录结构已标准化,包含原始波段与元数据文件,便于研究者开发更优的波段插值策略与模型泛化方法。
背景与挑战
背景概述
随着遥感技术在农业领域的深入应用,高质量标注数据集的匮乏成为制约机器学习模型发展的关键瓶颈。SICKLE数据集由印度德里信息技术学院与MS Swaminathan研究基金会于2023年联合发布,旨在填补多传感器卫星影像与关键农艺参数融合标注的数据空白。该数据集聚焦印度泰米尔纳德邦Cauvery三角洲的水稻种植区,覆盖2018年1月至2021年3月的时间序列,整合了Landsat-8、Sentinel-1与Sentinel-2卫星的多光谱、热红外与微波传感器数据,以3米、10米和30米多分辨率标注了21种作物类型及水稻品种、物候期与单产等多维参数。其首创性地将区域标准生长季纳入时间序列构建,推动了农业遥感向精细化、多任务协同分析的方向演进,为作物分类、物候预测与产量估算等任务提供了关键基准。
当前挑战
SICKLE数据集面临的挑战主要体现在领域问题与构建过程两方面。在领域层面,水稻生长季常伴随密集云层覆盖,光学影像质量受限,需开发多传感器(如雷达与光学)融合方法以提升模型在复杂气象条件下的鲁棒性;同时,小农地块平均面积仅0.38英亩,低分辨率标注易导致地块边界模糊或合并,亟需基于多分辨率标注的高分辨率推理技术。在构建层面,依赖农户回溯的实地调查数据存在噪声,标注结果更接近弱监督信号而非绝对真值,要求算法具备抗标注偏差能力;此外,数据集样本量有限且地域分布受灌溉条件、土壤异质性等因素影响,模型需在小样本环境下保持泛化性能,并克服地理协变量偏移对预测准确性的干扰。
常用场景
经典使用场景
在农业遥感领域,SICKLE数据集为多任务学习提供了理想的实验平台。其核心应用场景在于利用多传感器卫星时序影像,对印度高韦里三角洲地区的水稻种植进行精细化的参数反演。研究者能够基于同一地理区域的Landsat-8、Sentinel-1和Sentinel-2影像,同步开展作物类型分类、物候期预测与产量估算等任务,这种多参数协同分析的模式,有效模拟了真实农业监测中需综合多项指标进行决策的复杂场景。
实际应用
在实际农业生产与政策制定中,SICKLE数据集支持精细化农业管理与资源优化。其提供的田块级物候日期(播种、移栽、收割)与产量数据,可用于构建区域作物生长监测系统,帮助农技部门及时掌握种植进度、预估产量波动,并为水资源调配与灾害评估提供依据。多传感器数据的融合能力尤其适用于季风气候区的稻作监测,雷达数据可穿透云层弥补光学影像在雨季的缺失,从而保障监测的连续性,为粮食安全预警与农业保险定损提供可靠的数据支撑。
衍生相关工作
围绕SICKLE数据集,已衍生出多个前沿研究方向。在方法学层面,其推动了跨卫星传感器融合、时序超分辨率重建以及弱监督学习在农业遥感中的应用。例如,研究者可利用其多分辨率标注开发从低分辨率影像生成高分辨率推断图的方法;其包含的噪声实地调查数据也促进了基于弱标签的鲁棒性算法研究。在应用层面,该数据集为开发端到端的农田智能分析管道奠定了基础,相关模型可扩展至其他小农经济主导的地区,推动全球农业遥感模型的泛化能力与可部署性。
以上内容由遇见数据集搜集并总结生成



