isp-uv-es/SEN2NAIP|遥感图像处理数据集|超分辨率技术数据集
收藏SEN2NAIP 数据集概述
数据集介绍
SEN2NAIP 是一个大型遥感数据集,旨在支持传统和基于参考的超分辨率(SR)模型训练。该数据集分为两个主要部分:
- 跨传感器数据集:包含 2,851 对来自 Sentinel-2 L2A 的低分辨率(LR)图像和来自国家农业影像计划(NAIP)的高分辨率(HR)图像。
- 合成数据集:包含 17,657 对 NAIP 和 S2like 图像对,这些图像是通过降解模型生成的,以匹配 Sentinel-2 图像的特征。
数据集下载
数据集可以通过以下代码从 Hugging Face Hub 下载:
下载跨传感器数据集
python from huggingface_hub import hf_hub_download
hf_hub_download( repo_id="isp-uv-es/SEN2NAIP", repo_type="dataset", filename="cross-sensor/cross-sensor.zip" )
下载合成数据集
python for i in range(1, 19): hf_hub_download( repo_id="isp-uv-es/SEN2NAIP", repo_type="dataset", filename="synthetic/synthetic_%02d.zip" % i )
可复现示例
加载跨传感器数据集
python import rioxarray import torch
DEMO_PATH = "https://huggingface.co/datasets/isp-uv-es/SEN2NAIP/resolve/main/demo/"
cross_sensor_path = DEMO_PATH + "cross-sensor/ROI_0000/" hr_data = rioxarray.open_rasterio(cross_sensor_path + "hr.tif") lr_data = rioxarray.open_rasterio(cross_sensor_path + "lr.tif") hr_torch = torch.from_numpy(hr_data.to_numpy()) / 255 lr_torch = torch.from_numpy(lr_data.to_numpy()) / 10000
加载合成数据集
python import opensr_degradation import rioxarray import datasets import requests import tempfile import torch import json
def load_metadata(metadata_path: str) -> dict: tmpfile = tempfile.NamedTemporaryFile(suffix=".json") with requests.get(metadata_path) as response: with open(tmpfile.name, "wb") as file: file.write(response.content) metadata_json = json.load(open(tmpfile.name, "r")) return metadata_json
DEMO_PATH = "https://huggingface.co/datasets/isp-uv-es/SEN2NAIP/resolve/main/demo/"
synthetic_path = DEMO_PATH + "synthetic/ROI_0001/"
hr_early_data = rioxarray.open_rasterio(synthetic_path + "early/01__m_4506807_nw_19_1_20110818.tif") hr_early_torch = torch.from_numpy(hr_early_data.to_numpy()) / 255 hr_early_metadata = load_metadata(synthetic_path + "late/metadata.json") lr_hat, hr_hat = opensr_degradation.main.get_s2like( image=hr_early_torch, table=hr_early_metadata["sim_histograms"], model="gamma_multivariate_normal_50" )
import matplotlib.pyplot as plt fig, ax = plt.subplots(1, 3, figsize=(10, 5)) ax[0].imshow(hr_early_torch[[3, 1, 2]].permute(1, 2, 0)) ax[0].set_title("NAIP") ax[1].imshow(hr_hat[[3, 1, 2]].permute(1, 2, 0)*3) ax[1].set_title("NAIPhat") ax[2].imshow(lr_hat[[3, 1, 2]].permute(1, 2, 0)*3) ax[2].set_title("S2like") plt.show()

中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
LOL (LOw-Light dataset)
LOL 数据集由 500 个低光和正常光图像对组成,分为 485 个训练对和 15 个测试对。低光图像包含照片捕获过程中产生的噪声。大多数图像是室内场景。所有图像的分辨率均为 400×600。
OpenDataLab 收录
