five

GloSoFarID

收藏
github2024-05-06 更新2024-05-31 收录
下载链接:
https://github.com/yzyly1992/GloSoFarID
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含13,703个多光谱卫星图像样本,这些图像是在2021年至2023年间从全球各地的太阳能农场捕获的。数据集提供了详细的元数据,包括样本维度、分辨率、光谱名称和标签类。

This dataset comprises 13,703 multispectral satellite image samples, captured from solar farms across the globe between 2021 and 2023. It provides detailed metadata, including sample dimensions, resolution, spectral names, and label categories.
创建时间:
2023-12-12
原始信息汇总

数据集概述

名称: GloSoFarID 描述: 该数据集包含13,703个多光谱卫星图像样本,这些图像捕捉自2021至2023年间的多个太阳能农场,覆盖全球多个大陆。

数据集详细信息

  • 样本总数: 13,703
  • 正样本数: 6,793
  • 负样本数: 6,910
  • 输入样本维度: (256, 256, 13)
  • 掩码标签维度: (256, 256, 1)
  • 分辨率: 10米/像素
  • 光谱名称: [B1, B2, B3, B4, B5, B6, B7, B8, B8A, B9, B10, B11, B12]
  • 标签类别: {0: "背景", 1: "太阳能板"}

数据集预览

数据集预览展示了每个样本的13个波段及其对应的地面真实掩码,其中灰色区域表示太阳能农场。

基准测试

  • 模型: FCN, Half-UNet, UNet
  • 训练: 50个epoch,批量大小16
  • 性能指标:
    • FCN: IoU 71.81, FScore 82.87
    • Half-UNet: IoU 71.48, FScore 82.17
    • UNet: IoU 79.31, FScore 87.80

数据集使用

  • TensorFlow: 使用load_solar_dataset函数加载数据集。
  • 转换为图像: 通过运行python dataset_converter.py将数据集转换为多光谱.tif图像和.png掩码注释。
  • 转换器选项:
    • --path: 数据集文件夹路径
    • --file_name: 特定tfrecord.gz文件名
    • --include_jpg: 是否包含jpg预览
  • 环境要求: 安装tensorflow, pillow, numpy, tifffile库。
  • 存储需求: 转换后的.tif文件约占用24GB空间。
搜集汇总
数据集介绍
main_image_url
构建方式
GloSoFarID数据集通过整合2021年至2023年间全球范围内的多光谱卫星图像,精心构建了一个用于太阳能农场识别的综合数据集。该数据集涵盖了来自不同大陆的13,703个样本,每个样本包含13个光谱波段,分辨率为10米/像素。数据集的正样本和负样本分别对应太阳能面板区域和背景区域,确保了分类任务的全面性和多样性。通过详细的元数据记录,数据集提供了对每个样本的精确描述,从而为后续的模型训练和验证提供了坚实的基础。
特点
GloSoFarID数据集的显著特点在于其全球覆盖性和多光谱信息的丰富性。数据集不仅包含了高分辨率的卫星图像,还提供了详细的13个光谱波段信息,涵盖了从可见光到红外的广泛范围。此外,数据集的标签设计简洁明了,仅包含背景和太阳能面板两类,便于模型的快速训练和评估。通过对比不同模型的性能,数据集展示了其在太阳能农场识别任务中的高适用性和潜力。
使用方法
GloSoFarID数据集的使用方法灵活多样,适用于多种深度学习框架。对于TensorFlow用户,可以通过导入`load_solar_dataset`函数并执行`tf_data = load_solar_dataset()`来直接加载数据集。对于其他框架的用户,可以通过运行`python dataset_converter.py`将数据集转换为多光谱的.tif图像和.png掩码标注,便于进一步处理。转换过程中,用户可以选择性地生成JPG预览图像,并指定数据集路径和文件名。需要注意的是,转换后的数据集将占用约24GB的存储空间,确保设备具备足够的存储容量。
背景与挑战
背景概述
GloSoFarID数据集是由Zhiyuan Yang和Ryan Rad主导创建的全球多光谱卫星图像数据集,专门用于太阳能农场识别。该数据集涵盖了2021年至2023年间全球多个太阳能农场的13,703个样本,利用Sentinel-2卫星的多光谱波段(共13个波段)进行图像采集,分辨率为每像素10米。其核心研究问题在于通过多光谱图像分析,精准识别太阳能农场的分布情况,为可再生能源领域的研究提供了重要的数据支持。该数据集的发布不仅推动了太阳能农场识别技术的进步,还为相关领域的研究者提供了宝贵的资源,具有广泛的应用前景。
当前挑战
GloSoFarID数据集在构建过程中面临多项挑战。首先,多光谱图像的采集和处理需要高精度的技术支持,以确保数据的准确性和一致性。其次,全球范围内的太阳能农场分布广泛,数据采集的多样性和代表性成为一大难题。此外,数据集的标注工作复杂,尤其是对太阳能农场区域的精确标注,需要大量的人力和时间投入。在应用层面,如何有效利用多光谱信息进行模型训练,以提高识别精度,也是当前研究中的重要挑战。最后,数据集的存储和处理对硬件资源提出了较高要求,尤其是在转换为图像格式后,数据量庞大,对存储空间和计算能力提出了严峻考验。
常用场景
经典使用场景
GloSoFarID数据集在太阳能发电厂的识别与监测领域展现了其经典应用。通过整合全球范围内的多光谱卫星图像,该数据集为研究人员提供了丰富的样本,用于训练和验证太阳能板区域的自动识别模型。其高分辨率(10米/像素)和多光谱特性(13个波段)使得模型能够精准地从复杂背景中提取太阳能板区域,广泛应用于图像分割和目标检测任务。
解决学术问题
GloSoFarID数据集有效解决了太阳能发电厂识别中的关键学术问题,特别是在多光谱图像处理和目标检测领域。通过提供全球范围内的多样化样本,该数据集帮助研究人员克服了数据稀缺性和区域差异性带来的挑战,推动了太阳能板自动识别技术的进步。其对IoU和FScore等关键指标的提升,进一步验证了其在学术研究中的重要性和影响力。
衍生相关工作
GloSoFarID数据集的发布催生了一系列相关研究工作,特别是在深度学习模型的优化和应用方面。基于该数据集,研究人员开发了多种先进的图像分割和目标检测模型,如FCN、Half-UNet和UNet,显著提升了太阳能板识别的准确性和效率。此外,该数据集还为多光谱图像处理技术的研究提供了新的实验平台,推动了相关领域的技术进步和创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作