jonathan-roberts1/UC_Merced_LandUse_MultiLabel
收藏Hugging Face2023-04-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jonathan-roberts1/UC_Merced_LandUse_MultiLabel
下载链接
链接失效反馈官方服务:
资源简介:
UC_Merced_LandUse_MultiLabel数据集包含图像和标签两个主要特征。标签是序列化的,包含17个不同的类别,如飞机、裸土、建筑物、汽车、灌木丛、球场、码头、田野、草地、移动房屋、人行道、沙子、海洋、船只、坦克、树木和水。数据集分为训练集,包含2100个样本,总大小为438859816.5字节。数据集的下载大小为416309630字节。该数据集用于土地利用分类和多标签遥感图像检索。
The UC_Merced_LandUse_MultiLabel dataset includes two core components: image data and corresponding labels. The labels are serialized and encompass 17 distinct categories, namely airplane, bare soil, building, car, shrub, court, dock, field, grassland, mobile home, sidewalk, sand, ocean, boat, tank, tree, and water. The dataset is partitioned into a training set with 2100 samples, having a total size of 438,859,816.5 bytes and a download size of 416,309,630 bytes. This dataset is applied for land use classification and multi-label remote sensing image retrieval.
提供机构:
jonathan-roberts1
原始信息汇总
数据集概述
数据集名称
UC_Merced_LandUse_MultiLabel
数据集特征
- image:图像数据类型。
- label:标签序列,包含以下类别:
- airplane
- bare soil
- buildings
- cars
- chaparral
- court
- dock
- field
- grass
- mobile home
- pavement
- sand
- sea
- ship
- tanks
- trees
- water
数据集划分
- train:训练集,包含2100个样本,总大小为438859816.5字节。
数据集大小
- 下载大小:416309630字节
- 数据集总大小:438859816.5字节
许可证
其他(Public Domain; “Map services and data available from U.S. Geological Survey, National Geospatial Program.”)
搜集汇总
数据集介绍

构建方式
在遥感影像分析领域,UC_Merced_LandUse_MultiLabel数据集的构建体现了多标签标注的精细化处理。该数据集源自美国地质调查局(USGS)提供的公开地理空间数据,原始影像经过裁剪与标准化,形成2100张高分辨率遥感图像。每张图像均标注了多个土地覆盖类别,涵盖从自然地貌到人造设施的17种类型,如飞机、建筑、水体等,这些多标签信息基于半监督图论方法进行系统标注,确保了类别间的共存关系得到准确捕捉,为多标签土地覆盖分类研究提供了结构化基础。
特点
该数据集的核心特点在于其多标签标注体系与高分辨率影像的紧密结合。图像尺寸统一,每张包含丰富的空间细节,能够清晰呈现土地覆盖的复杂场景。标签体系覆盖17个互不排斥的类别,允许单张图像同时关联多个类别,如“建筑”与“道路”可能共存,这真实反映了实际地理环境的多样性。数据集的公开性与标准化格式便于直接应用于深度学习框架,支持遥感图像检索、土地覆盖分类等多任务研究,具有较高的学术与实用价值。
使用方法
使用该数据集时,研究者可通过HuggingFace平台直接加载,利用其预定义的训练分割进行模型开发。数据集以图像与标签序列的形式组织,图像可直接输入卷积神经网络进行特征提取,而多标签标注则适用于二元交叉熵等损失函数,以处理类别间的非互斥关系。典型应用包括训练多标签分类模型或遥感图像检索系统,用户可基于现有代码库进行微调,评估模型在复杂土地覆盖场景下的性能,推动遥感影像自动解译技术的进步。
背景与挑战
背景概述
UC_Merced_LandUse_MultiLabel数据集诞生于2010年,由加州大学默塞德分校的Yi Yang和Shawn Newsam等研究人员主导构建,其核心研究聚焦于遥感影像中的土地利用分类问题。该数据集作为经典UC Merced Land Use Dataset的扩展,引入了多标签标注体系,旨在更精确地刻画地表覆盖的复杂性与多样性,推动了计算机视觉与地理信息科学在遥感图像解译领域的深度融合,对后续的土地利用分析、环境监测及城市规划研究产生了深远影响。
当前挑战
该数据集致力于解决遥感影像多标签分类与检索的挑战,其核心难题在于如何有效处理同一影像中多种地物类别共存的语义复杂性,以及克服因类间相似性高、尺度变化大所导致的识别歧义。在构建过程中,挑战主要源于多标签标注的严谨性需求,需确保每个影像的多个标签准确反映真实地表状况,同时需协调来自不同来源的遥感数据在分辨率、光照和季节变化上的不一致性,以保障数据集的可靠性与泛化能力。
常用场景
经典使用场景
在遥感图像分析领域,UC_Merced_LandUse_MultiLabel数据集常被用于多标签土地覆盖分类任务。该数据集包含2100张高分辨率航拍图像,涵盖飞机、建筑物、水体等17个类别,每张图像可能对应多个标签,精准模拟了真实世界中土地覆盖的复杂性与重叠性。研究者利用这一特性,能够训练和评估深度学习模型在识别混合地物场景中的性能,推动了多标签分类算法的发展。
实际应用
在实际应用中,UC_Merced_LandUse_MultiLabel数据集为城市规划、环境监测和灾害评估提供了关键支持。例如,在城市扩张分析中,模型可同时识别建筑物、道路和植被,帮助决策者评估土地利用变化;在生态环境保护中,能够监测水体、森林和裸土的分布,辅助资源管理。这些应用显著提升了遥感技术的实用价值,服务于可持续发展目标。
衍生相关工作
基于该数据集,衍生了一系列经典研究工作。例如,早期研究采用词袋模型进行土地覆盖分类,为多标签方法奠定了基础;后续工作引入图论半监督方法,提升了遥感图像检索的准确性。这些成果不仅丰富了多标签遥感图像分析的理论体系,还激发了更先进的深度学习架构,如卷积神经网络在多标签场景中的优化与应用。
以上内容由遇见数据集搜集并总结生成



