five

CMP Dataset|计算机视觉数据集|建筑识别数据集

收藏
github2023-05-10 更新2024-05-31 收录
计算机视觉
建筑识别
下载链接:
https://github.com/wohaiyo/cmp_dataset
下载链接
链接失效反馈
资源简介:
CMP数据集由机器感知中心组装,包含来自世界各地不同城市的606张经过校正的立面图像,这些图像已手动标注。数据集涵盖了多种建筑风格,详细说明了数据来源、格式、处理方式以及12个类别的标注原则。

The CMP dataset, assembled by the Center for Machine Perception, comprises 606 rectified facade images from various cities around the globe, which have been manually annotated. This dataset encompasses a diverse range of architectural styles and provides detailed information on the data sources, formats, processing methods, as well as the annotation principles for 12 categories.
创建时间:
2020-04-21
原始信息汇总

CMP数据集概述

数据集基本信息

  • 名称: CMP数据集
  • 用途: 用于立面分割
  • 类别数: 5类
  • 下载链接: 百度网盘,提取码:vuhg
  • 收集机构: 机器感知中心
  • 图像数量: 606张校正后的立面图像
  • 图像来源: 来自世界各地不同城市的多种建筑风格

数据集内容

  • 图像: 包含多种立面图像
  • 标签: 包含12类标签
  • 彩色标签: 包含12类彩色标签
  • 5类标签: 包含"Outlier", "Wall", "Window", "Door", "Balcony"标签

标签颜色定义

  • 背景: (170, 0, 0)
  • 立面: (255, 0, 0)
  • 窗户: (255, 85, 0)
  • : (255, 170, 0)
  • 飞檐: (170, 255, 85)
  • 窗台: (0, 170, 255)
  • 阳台: (85, 255, 170)
  • 百叶窗: (0, 255, 255)
  • 装饰: (255, 255, 0)
  • 线脚: (0, 85, 255)
  • 柱子: (0, 0, 255)
  • 商店: (0, 0, 170)
AI搜集汇总
数据集介绍
main_image_url
构建方式
CMP数据集由机器感知中心精心构建,涵盖了来自全球不同城市的606张经过校正的建筑立面图像。这些图像源自多样化的建筑风格,并通过人工标注的方式进行了细致的分类。数据集的构建过程严格遵循了数据来源、格式处理及标注原则,确保了数据的准确性和多样性。
特点
CMP数据集以其丰富的类别标注而著称,提供了12个详细的类别标签,包括背景、立面、窗户、门等,每个类别均以特定的RGB颜色编码进行区分。此外,数据集还包含一个简化的5类别版本,便于不同研究需求的使用。图像的高质量和标注的精细度为建筑立面分割研究提供了坚实的基础。
使用方法
CMP数据集的使用方法简便直观,用户可通过提供的链接下载数据集。数据集包含图像文件夹和多个标签文件夹,分别存储原始图像和不同类别的标注信息。研究人员可根据需求选择使用12类别或5类别的标签进行模型训练和验证,从而推动建筑立面分割技术的发展。
背景与挑战
背景概述
CMP数据集由捷克技术大学机器感知中心(Center for Machine Perception)构建,旨在为建筑立面分割研究提供高质量的数据支持。该数据集包含606张来自全球不同城市的建筑立面图像,涵盖了多样化的建筑风格。每张图像均经过人工标注,标注类别包括背景、立面、窗户、门等12类,部分数据还提供了5类简化标注。CMP数据集的创建为建筑立面分割算法的开发与评估提供了重要基础,推动了计算机视觉在建筑领域的应用。
当前挑战
CMP数据集在解决建筑立面分割问题时面临多重挑战。首先,建筑立面的多样性和复杂性使得标注工作极为繁琐,尤其是在处理不同风格和结构的建筑时,标注的准确性和一致性难以保证。其次,数据集中图像的分辨率和光照条件差异较大,这对算法的鲁棒性提出了更高要求。此外,数据集的规模相对较小,可能限制了深度学习模型的泛化能力。在构建过程中,研究人员还需克服数据来源的多样性和标注标准的统一性等难题,以确保数据集的质量和可用性。
常用场景
经典使用场景
CMP数据集在建筑立面分割领域具有广泛的应用,尤其是在城市景观分析和建筑风格识别中。通过提供606张经过校正的建筑立面图像及其手动标注,该数据集为研究者提供了丰富的视觉信息,支持深度学习模型在立面分割任务中的训练与验证。其多样化的建筑风格和地理分布使得模型能够更好地泛化到不同的实际场景中。
实际应用
在实际应用中,CMP数据集被广泛用于城市规划、历史建筑保护以及智能建筑管理系统。通过精确的建筑立面分割,城市规划者可以更好地分析城市景观的分布与演变,历史建筑保护专家能够识别和修复建筑细节,而智能建筑管理系统则可以利用分割结果优化能源管理和空间利用。
衍生相关工作
CMP数据集衍生了许多经典研究工作,特别是在深度学习驱动的建筑立面分割领域。基于该数据集的研究成果包括多尺度分割网络、注意力机制优化模型以及跨域迁移学习方法。这些工作不仅推动了建筑立面分割技术的发展,还为其他视觉分割任务提供了重要的参考和启发。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

SuMeyYao/ysmpubmedclt

该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。

hugging_face 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录