DOTA v1.5|物体检测数据集|航空图像分析数据集
收藏Aerial-YOLO-DOTA: 先进航空影像目标检测
数据集
我们准备了一个易于使用的综合DOTA v1.5数据集,包括适合YOLOv9使用的标签。该数据集可在我们的Google Drive上获取。
实验结果与分析
100e-16b-0.01lr (最佳表现模型)
归一化混淆矩阵
最佳表现模型的归一化混淆矩阵显示了几个有趣的特征:
- 强对角线表现:许多类别显示出高真正率,表明沿对角线的深蓝色方块。网球场(0.89)、飞机(0.86)和篮球场(0.69)的分类尤其好。
- 主题一致的误分类:非对角线错误在视觉和上下文相似性方面具有直观意义:
- 船只有时被误分类为港口(0.20),反映了它们在场景中的共同出现。
- 小型车辆偶尔被误分类为大型车辆(0.17),可能是由于航空影像中的尺度模糊。
- 飞机和直升机之间存在一些相互混淆(直升机被分类为飞机的比例为0.29),这是由于它们共同的空中特性。
- 体育设施混淆:类似的体育设施之间存在一些误分类,例如足球场被误认为是其他类型的球场。
- 背景类别交互:“背景”类别与其他类别有显著交互,特别是桥梁(0.84)和集装箱起重机(1.00)。这表明在某些场景中区分这些结构与背景存在挑战。
- 无严重错误:值得注意的是,没有严重误分类(例如,飞机被误认为船只),表明模型已经学习了每个类别的意义特征。
- 特定类别的挑战:某些类别如“环岛”(0.33)和“小型车辆”(0.26)显示出较低的真正率,表明它们可能从额外的训练数据或特征工程中受益。
总体而言,混淆矩阵反映了一个模型,该模型已经学会了以上下文和主题上合理的方式区分类别,错误主要发生在视觉或功能上相似的对象类别之间。
F1分数曲线
F1分数曲线展示了模型在不同置信度阈值下的性能,揭示了其行为和有效性的关键见解。总体F1分数在置信度阈值为0.202时达到0.54,表明在精确度和召回率之间达到了最佳平衡。
精确度曲线
精确度曲线表明,随着置信度阈值的增加,所有类别的精确度都有所提高,这是预期的行为。这表明随着置信度的增加,模型的预测在所有类别中变得更加准确。
精确度-召回率曲线
精确度-召回率曲线展示了在不同阈值下精确度和召回率之间的权衡,揭示了模型在航空影像检测任务中的性能。关键发现包括:
- 总体性能:模型在所有类别中实现了0.512的平均精确度(mAP),表明总体性能中等。
- 类别差异:不同对象类别的性能存在显著差异:
- 网球场(0.940)和飞机(0.909)显示出优异的性能,即使在高召回率下也能保持高精确度。
- 篮球场(0.758)和港口(0.716)也表现良好。
- 桥梁(0.195)、足球场(0.301)和小型车辆(0.364)表现较差,随着召回率的增加,精确度迅速下降。
召回率曲线
召回率曲线显示了随着我们调整预测的置信度阈值,模型检测对象(召回率)的能力如何变化。关键发现包括:
- 总体性能:模型在所有类别中实现了0.53的平均召回率,表明总体检测能力中等。
- 类别差异:不同对象类别的召回率性能存在显著差异:
- 网球场、飞机和港口显示出优异的性能,即使在高置信度阈值下也能保持高召回率。
- 足球场、桥梁和集装箱起重机表现较差,随着置信度的增加,召回率迅速下降。
总体结果总结
总体结果总结提供了模型性能的全面视图,突出了关键性能指标及其影响。
- 损失减少:所有三个损失组件(box_loss、cls_loss和dfl_loss)在训练周期内都显示出一致的减少,表明模型正在有效学习。
- 收敛:损失似乎在训练结束时趋于稳定,表明模型在100个周期后基本收敛。
- 验证性能:验证损失紧随训练损失,表明良好的泛化能力,没有显著过拟合。
- 精确度和召回率:精确度和召回率指标都显示出随时间的稳步改善,召回率在早期周期中似乎改善得更明显。
- mAP性能:平均精确度(mAP)在0.5 IoU(mAP50)和0.5-0.95 IoU(mAP50-95)下都显示出一致的改善,最终达到约0.52的mAP50和0.35的mAP50-95。
- 学习动态:大多数指标的快速初始改善后逐渐增加,表明模型迅速学习主要特征,然后进行微调。
- 稳定性:metrics/precision和metrics/recall图显示出一些波动,这是正常的,但总体趋势是向上的。
- 改进空间:尽管性能良好,但最终的mAP值表明仍有改进的空间,可能通过更长时间的训练或架构调整。
这些结果表明了一个成功的训练过程,具有良好的泛化和多个指标的一致改善,为航空影像中的目标检测提供了坚实的基础。

Global Solar Dataset
在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。
github 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
Solar Radiation Data
该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。
www.nrel.gov 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录