five

GloSoFarID

收藏
arXiv2024-04-08 更新2024-06-21 收录
下载链接:
https://github.com/yzyly1992/GloSoFarID
下载链接
链接失效反馈
官方服务:
资源简介:
GloSoFarID是全球首个用于太阳能农场识别的卫星多光谱图像数据集,由东北大学温哥华分校计算机科学学院创建。该数据集包含13,703个样本,覆盖2021至2023年,涵盖全球多个地区的农村和城市区域。数据集通过整合历史全球地面实况、手动标注的美国地面实况和Sentinel-2多光谱卫星图像构建,每个样本包含13个多光谱波段,分辨率为256×256像素。GloSoFarID旨在通过提供精确的太阳能农场分布和增长数据,支持全球清洁能源转型的决策制定,解决全球能源可持续性问题。

GloSoFarID is the world's first satellite multispectral image dataset for solar farm identification, created by the School of Computer Science, Northeastern University Vancouver Campus. This dataset contains 13,703 samples, covering the years 2021 to 2023, and encompasses rural and urban areas across multiple global regions. The dataset is constructed by integrating historical global ground truth, manually annotated US ground truth, and Sentinel-2 multispectral satellite imagery. Each sample includes 13 multispectral bands with a resolution of 256×256 pixels. GloSoFarID aims to support decision-making for global clean energy transition by providing precise data on the distribution and growth of solar farms, addressing global energy sustainability issues.
提供机构:
东北大学温哥华分校计算机科学学院
创建时间:
2024-04-08
搜集汇总
数据集介绍
main_image_url
构建方式
为了构建GloSoFarID数据集,研究者采用了一个三步法,结合了现代技术。首先,他们从多个来源收集数据,包括2017-2018年的全球历史地面真实数据、2022-2023年由团队使用Google Earth Engine(GEE)手动注释的美国地面真实数据以及2017-2023年的Sentinel-2多光谱卫星图像。这些数据整合后,形成了包含10,230张多光谱图像的初始训练集,每张图像分辨率为256×256像素,包含13个光谱带。其次,他们使用几个最先进的模型对初始训练集进行训练,包括FCN、UNet、DeepLabV3、PSPNet、Swin、Swin-UNet、Mask2Former和SegFormer。这些模型在识别多光谱图像中的太阳能光伏发电场方面表现出色。最后,他们使用表现最好的三个模型来预测和标记2021-2023年的全球数据。这些模型的预测结果被逻辑OR组合成一个统一的数据集。为了确保数据集的质量和可靠性,他们实施了一个严格的质量控制过程,包括应用严格的过滤技术来去除伪影和孤立簇,并系统地消除任何错误或不准确的数据点。
特点
GloSoFarID数据集的特点在于其全面性、多样性和更新性。首先,它采用了中等分辨率的全球数据,包括农村地区,克服了地理覆盖范围的限制。其次,它提供了包含13个多光谱带的卫星图像,提供了更全面的信息,并以易于使用的格式提供,包括使用指南和脚本。最后,该数据集更新了2021-2023年的最新数据,是现有数据源的两倍,确保了对全球太阳能能源的当前和相关信息。
使用方法
GloSoFarID数据集可用于训练机器学习模型,以准确地绘制和分析全球太阳能光伏发电场的扩展和分布。数据集以易于使用的格式提供,包括使用指南和脚本,方便研究人员和开发人员使用。为了评估数据集,研究者使用了三个基准分割模型,即全卷积网络(FCN)、UNet和Half-UNet。这些模型的性能指标表明,GloSoFarID数据集在准确识别全球太阳能光伏发电场方面非常有效。
背景与挑战
背景概述
随着全球对清洁和可再生能源的需求不断增长,太阳能光伏(PV)技术作为一种无温室气体排放的能源转换方式,日益成为全球可持续能源转型的重要解决方案。然而,要全面了解和促进全球向清洁能源的转型,精确监测太阳能电池板农场变得至关重要。为此,Yang和Rad(2024)开发了GloSoFarID数据集,这是首个全面的全球多光谱卫星图像数据集,用于太阳能电池板农场的识别。该数据集旨在为训练强大的机器学习模型提供基础,以准确映射和分析全球太阳能电池板农场的扩张和分布。通过使用这些模型,研究人员可以深入了解全球清洁能源的采用情况,并为实现可持续能源的未来做出明智的决策。
当前挑战
GloSoFarID数据集面临着一些挑战。首先,构建全球规模的太阳能电池板农场数据集需要大量的时间和资源,特别是在数据收集和标注方面。其次,由于太阳能电池板农场的分布不均,数据集可能存在区域偏差,这可能会影响模型的泛化能力。此外,随着太阳能电池板农场的不断发展,数据集需要定期更新以保持其时效性和相关性。最后,由于太阳能电池板农场的光谱特征与其他地物可能存在重叠,因此开发能够准确识别太阳能电池板农场的机器学习模型仍然是一项挑战。
常用场景
经典使用场景
在太阳能光伏技术日益受到全球关注并被视为清洁和可再生能源解决方案的背景下,GloSoFarID数据集的诞生具有重要的意义。该数据集提供了全球太阳能光伏板农场的多光谱卫星图像,旨在为训练机器学习模型提供基础,以准确映射和分析全球太阳能光伏板农场的扩张和分布。这一数据集为研究全球太阳能能源的采用和发展提供了宝贵的资源。
解决学术问题
GloSoFarID数据集解决了以往数据集在地理覆盖范围、数据更新时效性和数据细节丰富性方面的不足。首先,该数据集采用了中等分辨率的全球数据,包括农村地区,弥补了以往数据集在地理覆盖范围上的局限性。其次,该数据集提供了13个波段的多光谱卫星图像,提供了更全面的信息,并以易于使用的格式呈现。最后,该数据集更新了2021年至2023年的最新数据,提供了对全球太阳能能源的当前和相关的见解。这些特点使得GloSoFarID数据集在学术研究中具有重要的意义。
衍生相关工作
GloSoFarID数据集的发布为相关研究提供了重要的基础。基于该数据集,研究人员可以进行太阳能光伏板农场的自动识别、分类和分割等方面的研究。此外,该数据集还可用于与其他数据集进行对比分析,以评估不同数据集在太阳能光伏板农场监测方面的性能差异。此外,该数据集还可用于开发新的机器学习模型,以提高太阳能光伏板农场监测的准确性和效率。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作