URUR

Name: URUR
Creator: 中国科学技术大学
Published: 2023-05-18 19:54:13
License: 暂无描述

arXiv2023-05-18 更新2024-06-21 收录

下载链接：

https://github.com/jankyee/URUR

下载链接

链接失效反馈

官方服务：

资源简介：

URUR数据集是由中国科学技术大学和阿里巴巴集团联合创建的一个大规模、高分辨率图像分割数据集。该数据集包含3008张分辨率为5120×5120的图像，覆盖63个城市，拥有超过100万个实例和8个类别，以及约800亿个手动标注的像素。数据集通过高质量的卫星图像数据源收集，经过精细的预处理和手动标注，确保了数据的高质量和丰富性。URUR数据集主要用于推动超高清图像分析技术的发展，特别是在环境监测、土地资源保护和城市规划等领域。

The URUR dataset is a large-scale, high-resolution image segmentation dataset jointly created by the University of Science and Technology of China and Alibaba Group. This dataset contains 3008 images with a resolution of 5120×5120, covering 63 cities, with over 1 million instances, 8 categories, and approximately 80 billion manually annotated pixels. The dataset is collected from high-quality satellite image data sources, and undergoes rigorous preprocessing and manual annotation to ensure its high quality and richness. The URUR dataset is primarily used to promote the development of ultra-high-definition image analysis technologies, especially in fields such as environmental monitoring, land resource conservation, and urban planning.

提供机构：

中国科学技术大学

创建时间：

2023-05-18

搜集汇总

数据集介绍

构建方式

在超高分辨率图像语义分割领域，现有数据集在规模、场景多样性和标注精细度方面存在局限。URUR数据集通过系统化流程构建：首先从公开卫星影像源采集了覆盖63个城市的10,240×10,240像素原始影像，依据低歧义性、高多样性和隐私保护原则筛选场景。为增强数据多样性，每个场景采集多粒度视角影像，最终将752张原始影像分割为3,008张5,120×5,120像素的标准图像。标注阶段采用高效策略，先将每张超高分辨率图像均匀裁剪为重叠的1,000×1,000像素小块，由标注员分别标注后合并，并借助预训练模型生成初始掩码作为参考，显著提升了标注效率和一致性。

使用方法

URUR数据集为超高分辨率图像语义分割算法的训练、验证与评估提供了标准化基准。数据集已按约7:1:2的比例划分为包含2,157张图像的训练集、280张图像的验证集和571张图像的测试集，便于研究者进行模型开发与性能比较。在使用时，研究者可加载原始图像及其对应的精细标注掩码，输入分割网络进行训练。针对超高分辨率图像带来的内存与计算挑战，论文提出了WSDNet框架作为参考解决方案，该框架集成了多级离散小波变换与逆变换以保留空间细节，并设计了小波平滑损失函数。评估时可采用交并比、F1分数、准确率等标准指标，并在RTX 2080Ti等硬件上衡量内存占用与推理速度，以全面评估模型在精度、效率与资源消耗间的平衡能力。

背景与挑战

背景概述

随着摄影与传感器技术的飞速发展，超高分辨率图像的获取与分析为计算机视觉领域开辟了新的疆界，在灾害防控、环境监测、土地资源保护及城市规划等诸多应用中扮演着日益重要的角色。在此背景下，由中国科学技术大学、阿里巴巴集团及上海交通大学的研究团队于2023年联合构建了URUR数据集，其全称为“Ultra-High Resolution dataset with Ultra-Rich Context”。该数据集旨在为超高分辨率语义分割领域提供一个大规模、场景广泛且具有全细粒度密集标注的基准。URUR共包含3,008张分辨率高达5,120×5,120的图像，覆盖全球63个城市的复杂场景，并提供了涵盖8个类别的约800亿手工标注像素，其图像数量、分辨率、上下文丰富度及标注精细度均显著超越了DeepGlobe、Inria Aerial等现有同类数据集，为推进该领域的前沿研究奠定了坚实的数据基础。

当前挑战

URUR数据集所应对的核心领域挑战在于超高分辨率图像的语义分割。此类图像视野广阔，内部目标在尺度与形态上对比极为悬殊，且场景上下文极为复杂，传统为自然图像设计的模型难以直接高效处理，需在精度、内存占用与推理速度之间取得精妙平衡。在数据集构建过程中，主要面临两大挑战：其一，标注工作极为繁重，因图像分辨率极高，待标注目标数量呈二次增长，且多类别目标常空间交错，给精细区分带来巨大困难；其二，为确保数据质量与多样性，需从海量卫星影像中依据低歧义性、高多样性及隐私保护等严格标准筛选场景，并设计高效的切分标注流程以兼顾标注效率与一致性，整个过程耗费巨大人力并需克服诸多技术障碍。

常用场景

经典使用场景

在超高分辨率图像语义分割领域，URUR数据集为算法模型提供了前所未有的基准测试平台。其核心应用场景在于评估和推动模型在复杂城市场景下的精细解析能力，数据集涵盖63个城市、8个类别、超过百万个实例的像素级标注，为模型处理大规模、高密度、多尺度目标提供了理想的训练与验证环境。通过提供5120×5120分辨率的图像，该数据集能够充分检验模型在保留空间细节与提取高层语义之间的平衡能力，成为该领域方法性能评估的黄金标准。

解决学术问题

URUR数据集有效解决了超高分辨率图像分割领域长期存在的标注稀缺与场景单一问题。传统数据集如DeepGlobe和Inria Aerial在图像数量、分辨率、标注精细度和场景多样性方面存在明显局限，难以支撑复杂模型的训练与验证。URUR通过提供大规模、全类别、细粒度标注的图像，使得研究者能够系统探究模型在极端分辨率下对上下文信息的建模能力，推动了记忆效率、推理速度与分割精度三者协同优化的理论发展，为超高分辨率视觉理解奠定了新的数据基础。

实际应用

该数据集在遥感图像分析、智慧城市建设、土地资源监测等领域具有显著应用价值。其覆盖的建筑物、农田、道路、水体等八类地物标签，可直接服务于城市规划中的土地利用分类、环境变化检测、灾害评估等实际任务。例如，通过训练在该数据集上的分割模型，可实现对大范围卫星影像的自动化地物提取，为国土调查、农业估产、城市扩张分析提供高精度、高效率的技术支撑，推动地理信息系统与计算机视觉的深度融合。

数据集最近研究