RarePlanes: Synthetic Data Takes Flight|飞机检测数据集|卫星图像分析数据集
收藏数据集概述
1. 实例分割
-
RarePlanes: Synthetic Data Takes Flight
数据集包含合成数据(630k飞机,50k图像)和真实数据(14.7k飞机,253 Worldview-3图像(0.3m分辨率),122个位置,22个国家)的飞机注释和属性以及卫星图像。 -
Agriculture-Vision Database & CVPR 2020 challenge
包含21k航空农田图像(RGB-NIR,美国,2019季节,512x512px芯片),6种田间异常模式(云影,双植物,播种机跳过,积水,水道和杂草簇)的标签掩码。 -
Spacenet Challenge Round 6 - Multi-Sensor All Weather Mapping
包含48k建筑足迹(增强的3DBAG数据集,建筑高度属性),Capella Space SAR数据(0.5m分辨率,四种极化)和Worldview-3图像(0.3m分辨率),鹿特丹,荷兰。 -
xView 2 Building Damage Asessment Challenge
包含550k建筑足迹和4种损坏等级,20个全球位置和7种灾害类型(野火,滑坡,大坝崩溃,火山爆发,地震/海啸,风,洪水),Worldview-3图像(0.3m分辨率),预训练的基准模型。 -
Microsoft BuildingFootprints
包含12.6mil(加拿大),125.2mil(美国)和17.9mil(乌干达/坦桑尼亚)建筑足迹,GeoJSON格式,基于Bing图像使用ResNet34架构进行划分。
2. 对象检测
-
DOTA: Large-scale Dataset for Object Detection in Aerial Images v1.5
包含15个类别,188k实例,Google Earth图像芯片,Faster-RCNN基准模型(MXNet),DOTA开发工具包,仅限学术使用。 -
xView 2018 Detection Challenge
包含60个类别,1百万实例,Worldview-3图像(0.3m分辨率),COCO数据格式,预训练的Tensorflow和Pytorch基准模型。 -
Stanford Drone Data
包含60个航空无人机视频,斯坦福校园和边界框,6个类别(行人,自行车手,滑板手,手推车,汽车,公共汽车)。
3. 语义分割
-
95-Cloud: A Cloud Segmentation Dataset
包含34701个手动分割的384x384补丁,带有云掩码,Landsat 8图像(R,G,B,NIR; 30m分辨率)。 -
Open Cities AI Challenge
包含790k建筑足迹,从Openstreetmap(2个标签质量类别),航空图像(0.03-0.2m分辨率,RGB,11k 1024x1024芯片,COG格式),非洲10个城市。
4. 场景分类
- BigEarthNet: Large-Scale Sentinel-2 Benchmark
包含基于CORINE Land Cover(CLC)2018的多重土地覆盖标签,590,326个来自Sentinel-2 L2A场景的芯片(125个Sentinel-2瓦片,来自10个欧洲国家,2017/2018),66 GB档案。
5. 其他任务
- IEEE Data Fusion Contest 2020
基于SEN12MS数据集(见类别语义分割)的陆地覆盖分类,低分辨率和高分辨率轨道。

GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
MECCANO
MECCANO数据集是首个专注于工业类似环境中第一人称视角下人类-物体交互的研究数据集。该数据集由20名参与者在模拟工业场景中构建摩托车玩具模型的视频组成,包含299,376帧视频数据。数据集不仅标注了时间上的动作片段,还标注了空间上的活跃物体边界框,涵盖了12种动词、20种名词和61种独特动作的分类。MECCANO数据集旨在推动工业环境中第一人称视角下人类动作识别、活跃物体检测、活跃物体识别及第一人称视角下人类-物体交互检测等任务的研究。
arXiv 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录