five

US Power Plants NAIP/LANDSAT8 Dataset

收藏
github2018-12-06 更新2024-05-31 收录
下载链接:
https://github.com/bl166/UsPowerPlantDataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专注于美国大陆的电力设施,提供高分辨率(1米)和中分辨率(15米)的图像,用于检测/分割任务。数据源包括NAIP提供的高分辨率图像和Landsat8提供的中分辨率图像,以及EPA EGRID文档提供的经纬度位置。

This dataset focuses on power facilities across the continental United States, offering high-resolution (1-meter) and medium-resolution (15-meter) images for detection/segmentation tasks. The data sources include high-resolution images provided by NAIP and medium-resolution images from Landsat 8, along with latitude and longitude locations provided by EPA EGRID documents.
创建时间:
2017-07-26
原始信息汇总

数据集概述

数据集名称

  • US Power Plants NAIP/LANDSAT8 Dataset

数据集目的

  • 专注于美国本土的电力设施,提供高分辨率(1m)和中等分辨率(15m)的图像,用于检测/分割任务。

数据来源

  • NAIP:提供高分辨率图像
  • Landsat8:提供中等分辨率图像
  • EPA EGRID文档:提供经纬度位置信息

数据集内容

  1. /uspp_naip:高分辨率电力设施图像(约1115x1115像素,每张约5MB),用于收集标注。
  2. /uspp_landsat:中等分辨率电力设施图像(约75x75像素,每张约70KB),用于分类。
  3. /annotations*:包含信心和二进制掩码,表示电力设施的轮廓。
    • accepted_ann_json.txt:从Amazon Mechanical Turk收集的接受标注,以JSON文本形式存储。
    • /confidence:信心图,每个像素的值等于标记其为电力设施部分的标注者数量。
    • /binary:二进制掩码,每个像素表示是否超过半数标注者同意其为电力设施部分。
  4. /exceptions*:无有效标注的实例(可能无可见电力设施或所有三个标注均被拒绝)。
  5. uspp_metadata.geogson*:包含地理位置、唯一egrid ID、设施名称、州和县名称、主要燃料、化石燃料类别、容量因子、铭牌容量和CO<sub>2</sub>排放数据。
  6. egrid2014_data_v2_PLNT14.xlsx:EGRID文档的子集,包含美国电力设施位置和其他信息。

数据集构建

  • 数据准备(P1DATAPREP):下载卫星图像。
  • 标注生成(P2ANNOGEN):收集电力设施的标注。
  • 数据处理(P3DATAPROC):合并接受的标注,创建二进制标签,编译元数据。
  • 测试分类器(P4TESTCLSFR,可选):通过像素基础分类进行图像分割。

数据集测试

  • 使用**classify_sample(.py)**进行简单的分割任务(像素级分类)测试。

数据集总结

  • 该数据集提供了美国电力设施的高分辨率和中等分辨率图像,以及相关的标注和元数据,适用于电力设施的检测和分割任务。数据集的构建涉及从多个来源收集数据,并通过多个阶段处理和验证数据。
搜集汇总
数据集介绍
main_image_url
构建方式
LANDSAT8 Dataset的构建分为数据准备、标注生成、数据加工三个阶段。首先,通过Google Earth Engine下载高分辨率NAIP和中等分辨率Landsat8卫星影像。其次,利用Amazon Mechanical Turk收集 annotators 对 power plants 的标注信息。最后,合并接受的标注信息,创建二进制标签,并编译元数据信息。
使用方法
使用该数据集时,用户需要先准备好相关依赖环境和库,然后运行提供的脚本进行数据集构建。对于测试,数据集提供了一个基于像素分类的简单分割任务示例。用户可以通过运行classify_sample.py脚本来测试数据集,并查看交叉验证结果和特定案例的测试结果。
背景与挑战
背景概述
LANDSAT8 Dataset是由杜克大学的研究团队于2017年构建的一个数据集,专注于美国本土的发电厂。该数据集提供了高分辨率(1米)和中等分辨率(15米)的卫星图像,用于检测和分割任务。数据来源包括NAIP提供的高分辨率图像、Landsat8提供的中等分辨率图像,以及EPA EGRID文档提供的发电厂经纬度位置信息。该数据集的构建经历了数据准备、注释生成、数据处理等阶段,并可选地进行图像分割分类器的测试。LANDSAT8 Dataset对于电力基础设施的自动检测与分割研究具有重要价值,对相关领域产生了显著影响。
当前挑战
在构建LANDSAT8 Dataset的过程中,研究人员面临了多个挑战。首先,卫星图像的下载与预处理需要克服数据量大、处理复杂的问题。其次,注释生成阶段需要确保标注的质量与一致性,这对于后续的自动检测至关重要。此外,数据集构建中的地理信息系统(GIS)整合与元数据管理也是一个挑战。在所解决的领域问题方面,LANDSAT8 Dataset的挑战在于如何准确地进行电力设施的检测与分割,特别是在不同的分辨率和图像条件下保持高精度。
常用场景
经典使用场景
LANDSAT8 Dataset作为一种专注于美国本土电厂的中高分辨率卫星图像数据集,其经典使用场景主要定位于电力设施的检测与分割任务。该数据集利用高分辨率NAIP图像与中分辨率Landsat8图像,为研究者提供了丰富的视觉信息,使其能够精确标注电厂位置并进行详细的形态分析。
解决学术问题
该数据集解决了电力设施定位、分类以及排放量估算等学术研究问题,对于推动能源领域的遥感监测技术发展具有重要的意义。通过提供精确的地理信息和电厂轮廓标注,LANDSAT8 Dataset极大地促进了电力设施自动检测算法的开发和验证,有助于提升能源管理效率和环境保护。
实际应用
在实际应用中,LANDSAT8 Dataset可被用于环境监管、能源规划、灾害响应等多个领域。例如,环保机构可以利用此数据集监测电厂的CO2排放情况,城市规划者则可用于评估电力设施的分布与城市发展的匹配度,进而优化城市能源结构。
数据集最近研究
最新研究方向
LANDSAT8 Dataset作为专注于美国本土发电厂的数据集,其最新研究方向主要聚焦于利用高分辨率和中等分辨率的卫星图像进行电力设施的检测与分割任务。该数据集的构建融合了NAIP与Landsat8的影像资料,并辅以EPA EGRID文档提供的地理坐标信息,使得研究者能够开展关于电力基础设施的地理分布、类型分类以及排放量估算等研究。目前,该数据集在本领域的前沿研究方向包括但不限于:深度学习模型在电力设施自动识别中的应用、多源数据融合以提高分类精度、以及基于卫星图像的电力设施变化监测。这些研究对于能源管理、环境监测和城市规划等方面具有重要的实际影响和意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作