five

iSAID|航空影像数据集|实例分割数据集

收藏
arXiv2019-08-28 更新2024-06-21 收录
航空影像
实例分割
下载链接:
https://captain-whu.github.io/iSAID/index.html
下载链接
链接失效反馈
资源简介:
iSAID是一个大规模的航空影像实例分割数据集,由人工智能起源研究所创建。该数据集包含2,806张高分辨率图像,涵盖15个类别,共有655,451个对象实例。数据集的创建过程包括从零开始独立标注,确保每个实例的精确像素级标注。iSAID特别适用于复杂航空场景的实际应用,如安全监控和城市规划,旨在解决航空影像中实例分割的挑战,如大量实例、大规模对象尺度变化和丰富的微小对象。
提供机构:
人工智能起源研究所,阿联酋
创建时间:
2019-05-30
AI搜集汇总
数据集介绍
main_image_url
构建方式
iSAID数据集的构建基于DOTA数据集,并对其进行了全新的标注。该数据集由2,806张高分辨率图像组成,包含15个类别和655,451个实例。为了确保标注的准确性和一致性,数据集采用了严格的标注流程,包括制定标注指南、培训标注员、标注图像、质量检查和标注优化等步骤。数据集的标注工作由专业的标注员完成,并经过专家的审核和验证,确保了标注的质量和精度。
特点
iSAID数据集具有以下特点:1) 图像分辨率高,范围从800到13,000像素;2) 实例数量众多,每个图像平均含有约239个实例;3) 类别多样,包含15个重要且常见的类别;4) 实例大小差异大,包含小、中、大三种尺寸的物体;5) 类别不平衡,某些类别实例数量较少;6) 物体形状和方向多样,包含大量长宽比大的物体;7) 标注精确,每个实例都进行了像素级别的标注。
使用方法
iSAID数据集可用于实例分割和目标检测等任务。使用该数据集时,首先需要对图像进行预处理,例如将图像裁剪成800×800像素的小块,并生成相应的标注。然后,可以使用现有的实例分割和目标检测算法,如Mask R-CNN和PANet,在数据集上进行训练和测试。此外,为了更好地适应航空图像的特点,可以对算法进行一些修改,例如增加检测框的数量、使用多尺度增强和调整NMS阈值等。最后,可以使用标准COCO指标对算法的性能进行评估。
背景与挑战
背景概述
iSAID数据集,全称Instance Segmentation in Aerial Images Dataset,是由来自阿联酋的Inception Institute of Artificial Intelligence、中国的武汉大学以及华中科技大学的研究人员共同创建的。该数据集于2019年8月发布,旨在解决现有地球视觉数据集在实例分割任务上的不足。与仅适用于语义分割或目标检测的数据集不同,iSAID数据集首次将实例级目标检测和像素级分割任务相结合,为航空图像的实例分割提供了丰富的数据支持。iSAID数据集包含了2,806张高分辨率图像,共标注了15个类别、655,451个实例,为复杂的航空场景提供了详实的分析基础。相较于现有的其他小规模航空图像实例分割数据集,iSAID数据集在实例数量和类别数量上均有显著提升,使其成为该领域最具挑战性和实用价值的数据集之一。
当前挑战
iSAID数据集的创建和利用面临着诸多挑战。首先,航空图像的实例分割任务本身就是一个极具挑战性的问题,它要求算法能够对图像中的每一个目标进行精确的像素级定位。此外,航空图像中的实例数量众多,且存在大规模、方向和形状的变异,这对现有的实例分割算法提出了更高的要求。其次,在构建数据集的过程中,研究人员需要克服航空图像的高分辨率、实例密度大、类别不平衡等挑战,以保证标注的准确性和完整性。最后,由于现有的实例分割算法大多针对自然场景设计,直接应用于航空图像往往效果不佳,因此需要研究社区开发专门的解决方案,以适应航空图像的特有挑战。
常用场景
经典使用场景
在地球视觉领域,iSAID数据集被广泛用于实例分割任务,特别是在需要精确定位和分类的航空图像中。该数据集包含了大量的实例和类别,使其成为研究和开发高级视觉算法的理想选择。通过使用iSAID数据集,研究人员可以训练模型来识别和分割航空图像中的对象,如飞机、船只、储油罐等。这些模型可以用于多种应用,包括城市规划和安全监控。
解决学术问题
iSAID数据集解决了航空图像中实例分割的挑战,这些图像通常具有高密度实例、对象大小和方向的巨大变化以及大量的微小对象。与其他数据集相比,iSAID提供了更精确的像素级标注,确保了每个实例的精确定位,这对于详细的场景分析至关重要。此外,iSAID包含的实例和类别数量远超现有数据集,使其成为研究和开发先进视觉算法的理想选择。
衍生相关工作
iSAID数据集的发布推动了地球视觉领域的研究和发展。基于iSAID数据集的研究工作不断涌现,包括改进的实例分割算法和针对航空图像的定制模型。这些研究工作为地球视觉领域的研究和应用提供了新的方向和可能性,推动了该领域的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

全国兴趣点(POI)数据

  POI(Point of Interest),即兴趣点,一个POI可以是餐厅、超市、景点、酒店、车站、停车场等。兴趣点通常包含四方面信息,分别为名称、类别、坐标、分类。其中,分类一般有一级分类和二级分类,每个分类都有相应的行业的代码和名称一一对应。  POI包含的信息及其衍生信息主要包含三个部分:

CnOpenData 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录