five

Awesome Satellite Imagery Datasets

收藏
github2020-03-26 更新2024-05-31 收录
下载链接:
https://github.com/doc22940/awesome-satellite-imagery-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
包含多个用于计算机视觉和深度学习的卫星图像数据集,每个数据集都有详细的标注信息,涵盖实例分割、目标检测、语义分割、场景分类等多个类别。

This dataset comprises multiple satellite image datasets designed for computer vision and deep learning applications. Each dataset is accompanied by detailed annotations, covering a variety of categories such as instance segmentation, object detection, semantic segmentation, and scene classification.
创建时间:
2020-03-26
原始信息汇总

数据集概述

1. 实例分割

  • Agriculture-Vision Database & CVPR 2020 challenge

    • 数据来源:UIUC, Intelinair, CVPR
    • 数据内容:21k 航空农田图像(RGB-NIR,美国,2019年季节,512x512px芯片),6种田间异常模式标签掩码
    • 发布时间:2020年1月
  • Spacenet Challenge Round 6 - Multi-Sensor All Weather Mapping

    • 数据来源:CosmiQ Works, Capella Space, Maxar, AWS, Intel
    • 数据内容:48k 建筑足迹(增强3DBAG数据集,建筑高度属性),Capella Space SAR数据(0.5m分辨率,四种极化)& Worldview-3图像(0.3m分辨率)
    • 发布时间:2020年2月
  • xView 2 Building Damage Asessment Challenge

    • 数据来源:DIUx
    • 数据内容:550k 建筑足迹 & 4种损坏等级类别,20个全球位置和7种灾难类型,Worldview-3图像(0.3m分辨率),预训练基线模型
    • 发布时间:2019年11月
  • Microsoft BuildingFootprints

    • 数据来源:Microsoft
    • 数据内容:加拿大12.6mil、美国125.2mil、乌干达/坦桑尼亚17.9mil建筑足迹,GeoJSON格式,基于Bing图像使用ResNet34架构划定
    • 发布时间:2019年3月
  • Spacenet Challenge Round 4 - Off-nadir

    • 数据来源:CosmiQ Works, DigitalGlobe, Radiant Solutions, AWS
    • 数据内容:126k 建筑足迹(亚特兰大),27 WorldView 2图像(0.3m分辨率),从7-54度偏离天底角,双三次重采样以对抗高偏离天底角时的原生粗糙分辨率
    • 发布时间:2018年12月
  • Airbus Ship Detection Challenge

    • 数据来源:Airbus
    • 数据内容:131k 船只,104k 训练/88k 测试图像芯片,卫星图像(1.5m分辨率),运行长度编码格式中的栅格掩码标签,Kaggle内核
    • 发布时间:2018年11月
  • Open AI Challenge: Tanzania

    • 数据来源:WeRobotics & Worldbank
    • 数据内容:建筑足迹 & 3种建筑条件,RGB UAV图像
    • 发布时间:2018年11月
  • Netherlands LPIS agricultural field boundaries

    • 数据来源:荷兰经济事务部
    • 数据内容:294种作物/植被类别,780k 地块,2009-2018年年度数据集
    • 发布时间:不详
  • Denmark LPIS agricultural field boundaries

    • 数据来源:丹麦农业部
    • 数据内容:293种作物/植被类别,600k 地块,2008-2018年年度数据集
    • 发布时间:不详
  • CrowdAI Mapping Challenge

    • 数据来源:Humanity & Inclusion NGO
    • 数据内容:建筑足迹,RGB卫星图像,COCO数据格式
    • 发布时间:2018年5月
  • Spacenet Challenge Round 2 - Buildings

    • 数据来源:CosmiQ Works, Radiant Solutions, NVIDIA
    • 数据内容:685k 建筑足迹,3/8band Worldview-3图像(0.3m分辨率),5个城市,SpaceNet Challenge资产库
    • 发布时间:2017年5月
  • Spacenet Challenge Round 1 - Buildings

    • 数据来源:CosmiQ Works, Radiant Solutions, NVIDIA
    • 数据内容:建筑足迹(里约热内卢),3/8band Worldview-3图像(0.5m分辨率),SpaceNet Challenge资产库
    • 发布时间:2017年1月

2. 目标检测

  • DOTA: Large-scale Dataset for Object Detection in Aerial Images v1.5

    • 数据来源:武汉大学
    • 数据内容:15个类别,188k 实例,Google Earth图像芯片,Faster-RCNN基线模型(MXNet),DOTA开发工具包,仅限学术使用
    • 发布时间:2019年6月
  • xView 2018 Detection Challenge

    • 数据来源:DIUx
    • 数据内容:60个类别,1百万实例,Worldview-3图像(0.3m分辨率),COCO数据格式,预训练Tensorflow和Pytorch基线模型
    • 发布时间:2018年7月
  • Open AI Challenge: Aerial Imagery of South Pacific Islands

    • 数据来源:WeRobotics & Worldbank
    • 数据内容:树位置 & 4种树种,RGB UAV图像(0.4m/0.8m分辨率),多个AOI在汤加
    • 发布时间:2018年5月
  • NIST DSE Plant Identification with NEON Remote Sensing Data

    • 数据来源:inria.fr
    • 数据内容:树位置,树种和冠层参数,高光谱(1m分辨率)& RGB图像(0.25m分辨率),LiDAR点云和冠层高度模型
    • 发布时间:2017年10月
  • NOAA Fisheries Steller Sea Lion Population Count

    • 数据来源:NOAA
    • 数据内容:5种海狮类别,约80k 实例,约1k 航空图像,Kaggle内核
    • 发布时间:2017年6月
  • Spacenet Rio De Janeiro Points of Interest Dataset

    • 数据来源:CosmiQ Works, Radiant Solutions
    • 数据内容:460个类别,120k 点(11k 手动确认),3/8band Worldview-3图像(0.5m分辨率),SpaceNet Challenge资产库
    • 发布时间:2017年1月
  • Stanford Drone Data

    • 数据来源:斯坦福大学
    • 数据内容:60个航空UAV视频,斯坦福大学校园和边界框,6个类别(行人,自行车手,滑板手,手推车,汽车,公共汽车)
    • 发布时间:2016年10月
  • Cars Overhead With Context (COWC)

    • 数据来源:劳伦斯利弗莫尔国家实验室
    • 数据内容:32k 汽车边界框,航空图像(0.15m分辨率),6个城市
    • 发布时间:2016年9月

3. 语义分割

  • 95-Cloud: A Cloud Segmentation Dataset

    • 数据来源:S. Mohajerani et. all
    • 数据内容:34701个手动分割的384x384补丁,带有云掩码,Landsat 8图像(R,G,B,NIR; 30 m分辨率)
    • 发布时间:2020年1月
  • Open Cities AI Challenge

    • 数据来源:GFDRR
    • 数据内容:790k 建筑足迹来自Openstreetmap(2个标签质量类别),航空图像(0.03-0.2m分辨率,RGB,11k 1024x1024芯片,COG格式),10个非洲城市
    • 发布时间:2020年3月
  • DroneDeploy Segmentation Dataset

    • 数据来源:DroneDeploy
    • 数据内容:无人机图像(0.1m分辨率,RGB),标签(7个土地覆盖类别:建筑,杂乱,植被,水,地面,汽车)& 高程数据,基线模型实现
    • 发布时间:2019年12月
  • SkyScapes: Urban infrastructure & lane markings

    • 数据来源:DLR
    • 数据内容:高度精确的街道车道标记(12个类别,例如虚线,长线,斑马区)& 城市基础设施(19个类别,例如建筑,道路,植被)。航空图像(0.13 m分辨率),覆盖德国慕尼黑的5.7 km2
    • 发布时间:2019年11月
  • Open AI Challenge: Caribbean

    • 数据来源:MathWorks, WeRobotics, Worldbank, DrivenData
    • 数据内容:预测建筑屋顶类型(5个类别,例如混凝土,金属等),提供的建筑足迹(22,553),RGB UAV图像(4cm分辨率,7个加勒比国家中的3个地区的7个区域)
    • 发布时间:2019年12月
  • Spacenet Challenge Round 5 - Road Network Extraction, Routing, Travel Time Estimation

    • 数据来源:CosmiQ Works, Maxar, Intel, AWS
    • 数据内容:2300个图像芯片,街道几何形状与位置,形状和估计的旅行时间,3/8band Worldview-3图像(0.3m分辨率),4个全球城市,1个保留城市用于排行榜评估,APLS指标,基线模型
    • 发布时间:2019年9月
  • SEN12MS

    • 数据来源:TUM
    • 数据内容:180,748个相应的图像三元组,包含Sentinel-1(VV&VH),Sentinel-2(所有波段,无云),和MODIS衍生的土地覆盖图(IGBP,LCCS,17个类别,500m分辨率)。所有数据上采样到10m分辨率,地理参考,覆盖所有大陆和气象季节
    • 发布时间:2019年6月
  • Slovenia Land Cover Classification

    • 数据来源:Sinergise
    • 数据内容:10个土地覆盖类别,时间堆栈的Hyperspectral Sentinel-2图像(R,G,B,NIR,SWIR1,SWIR2; 10 m分辨率),2017年带云掩码,官方斯洛文尼亚土地使用土地覆盖层作为地面真相
    • 发布时间:2019年2月
  • ALCD Reference Cloud Masks

    • 数据来源:CNES
    • 数据内容:8个类别(包括云和云阴影),38个Sentinel-2场景(10 m分辨率)。手动标记 & 主动学习
    • 发布时间:2018年10月
  • Agricultural Crop Cover Classification Challenge

    • 数据来源:CrowdANALYTIX
    • 数据内容:2个主要类别玉米和大豆,Landsat 8图像(30m分辨率),USDA Cropland数据层作为地面真相
    • 发布时间:2018年7月
  • Spacenet Challenge Round 3 - Roads

    • 数据来源:CosmiQ Works, Radiant Solutions
    • 数据内容:8000 km的道路在5个城市AOI,3/8band Worldview-3图像(0.3m分辨率),SpaceNet Challenge资产库
    • 发布时间:2018年2月
  • Urban 3D Challenge

    • 数据来源:USSOCOM
    • 数据内容:157k 建筑足迹掩码,RGB正射影像(0.5m分辨率),DSM/DTM,3个城市,SpaceNet Challenge资产库
    • 发布时间:2017年12月
  • DSTL Satellite Imagery Feature Detection Challenge

    • 数据来源:Dstl
    • 数据内容:10个土地覆盖类别,57个1x1km图像,3/16-band Worldview 3图像(0.3m-7.5m分辨率),Kaggle内核
    • 发布时间:2017年2月
  • SPARCS: S2 Cloud Validation data

    • 数据来源:USGS
    • 数据内容:7个类别(云,云阴影,水上的云阴影等),80个1kx1k px。子集Landsat 8场景(30m分辨率)
    • 发布时间:2016年
  • Biome: L8 Cloud Cover Validation data

    • 数据来源:USGS
    • 数据内容:4个云类别(云,薄云,云阴影,清晰),96个Landsat 8场景(30m分辨率),12个生物群落,每个生物群落8个场景
    • 发布时间:2016年
  • Inria Aerial Image Labeling

    • 数据来源:inria.fr
    • 数据内容:建筑足迹掩码,RGB航空图像(0.3m分辨率),5个城市
    • 发布时间:不详
  • ISPRS Potsdam 2D Semantic Labeling Contest

    • 数据来源:ISPRS
    • 数据内容:6个城市土地覆盖类别,栅格掩码标签,4波段RGB-IR航空图像(0.05m分辨率)& DSM,38个图像补丁
    • 发布时间:不详

4. 场景分类(芯片/图像识别)

  • BigEarthNet: Large-Scale Sentinel-2 Benchmark

    • 数据来源:TU Berlin
    • 数据内容:基于CORINE Land Cover(CLC)2018的多个土地覆盖标签,590,326个芯片来自Sentinel-2 L2A场景(125个Sentinel-2瓦片,来自10个欧洲国家,2017/2018),66 GB档案
    • 发布时间:2019年1月
  • WiDS Datathon 2019 : Detection of Oil Palm Plantations

    • 数据来源:全球WiDS团队 & West Big Data Innovation Hub
    • 数据内容:预测油棕榈种植园的存在,Planet卫星图像(3m分辨率)。,约20k 256 x 256像素芯片,2个类别油棕榈和其他,注释者置信度分数
    • 发布时间:2019年1月
  • So2Sat LCZ42

    • 数据来源:TUM Munich & DLR
    • 数据内容:局部气候区分类,17个类别(10个城市,例如紧凑高层,7个农村,例如分散树木),400k 32x32像素芯片覆盖42个城市(LCZ42数据集),Sentinel 1 & Sentinel 2(均为10m分辨率),51 GB
    • 发布时间:2018年8月
  • Cactus Aerial Photos

    • 数据来源:CONACYT Mexico
    • 数据内容:17k航空照片,13k仙人掌,4k非仙人掌,Kaggle内核
    • 发布时间:2018年6月
  • Statoil/C-CORE Iceberg Classifier Challenge

    • 数据来源:Statoil/C-CORE
    • 数据内容:2个类别船和冰山,2波段HH/HV极化SAR图像,Kaggle内核
    • 发布时间:2018年1月
  • Functional Map of the World Challenge

    • 数据来源:IARPA
    • 数据内容:63个类别从太阳能农场到购物中心,1百万芯片,4/8波段卫星图像(0.3m分辨率),COCO数据格式,基线模型,
    • 发布时间:2017年12月
  • EuroSAT

    • 数据来源:DFK
    • 数据内容:10个土地覆盖类别从工业到永久作物,27k 64x64像素芯片,3/16波段Sentinel-2卫星图像(10m分辨率),覆盖30个国家的城市,
    • 发布时间:2017年8月
  • Planet: Understanding the Amazon from Space

    • 数据来源:Planet
    • 数据内容:13个土地覆盖类别 + 4个云条件类别,4波段(RGB-NIR)卫星图像(5m分辨率),亚马逊雨林,Kaggle内核
    • 发布时间:2017年7月
搜集汇总
数据集介绍
main_image_url
构建方式
Awesome Satellite Imagery Datasets 是一个收集了大量卫星图像数据集的列表,涵盖了从实例分割到场景分类等多种任务。这些数据集的构建主要依赖于从不同来源收集的高分辨率卫星图像,并通过众包或专业标注的方式为图像添加了相应的标签信息,以便于计算机视觉和深度学习的研究与应用。
特点
该数据集的特点在于其多样性、全面性和实用性。它包含了不同类型和来源的卫星图像,如光学、雷达和合成孔径雷达图像,涵盖了从农业、城市规划到灾害响应等多个应用领域。此外,数据集还提供了丰富的标注信息,包括实例分割、对象检测、语义分割和场景分类等,为研究人员提供了极大的方便。
使用方法
使用该数据集时,用户可以根据自己的研究需求选择合适的子集。数据集通常以图像和相应的标签文件形式提供,这些文件可以是图片格式、JSON格式或其他适合机器学习的数据格式。用户需要根据数据集的具体说明来加载和预处理数据,然后使用它们来训练、验证和测试机器学习模型。
背景与挑战
背景概述
Awesome Satellite Imagery Datasets 是一个旨在为计算机视觉和深度学习提供卫星图像数据集的列表。该数据集涵盖了从实例分割到场景分类等多种任务,包含了农业、建筑、道路等多个领域的卫星图像。创建于2017年,由多个研究机构和公司共同维护,其中包括UIUC、Intelinair、CVPR等。该数据集的核心理念是提供带有注释的卫星图像,以促进相关领域的研究与应用。
当前挑战
在构建过程中,数据集面临了多个挑战。首先,卫星图像的多样性和复杂性使得标注工作极具挑战性。其次,不同来源和分辨率的图像需要统一格式和标准化处理。此外,数据集的规模和多样性也带来了数据管理和维护的挑战。在研究领域,如何有效地利用这些数据进行模型训练和评估,以及如何处理数据中的噪声和异常值,也是当前面临的挑战。
常用场景
经典使用场景
Awesome Satellite Imagery Datasets汇集了多种卫星图像数据集,经典的使用场景包括农业模式分析、建筑物检测、道路提取、场景分类等。这些数据集支持了卫星图像处理和计算机视觉领域的研究,如通过分析农业领域的卫星图像来识别作物异常模式,或利用高分辨率卫星图像进行城市建筑物的自动检测等。
解决学术问题
该数据集解决了学术研究中卫星图像标注、分类、检测等关键问题,为研究者提供了丰富的数据资源,助力推动了遥感技术在农业、城市规划、环境监测等领域的应用。
衍生相关工作
基于该数据集,衍生出了多项相关研究工作,如IEEE数据融合竞赛、DEEPGLOBE卫星挑战等,这些工作进一步推动了卫星图像分析技术在学术研究和实际应用中的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作