five

CubiCasa5K

收藏
arXiv2019-04-03 更新2024-06-21 收录
下载链接:
https://github.com/CubiCasa/CubiCasa5k
下载链接
链接失效反馈
官方服务:
资源简介:
CubiCasa5K是由阿尔托大学和CubiCasa公司合作创建的大型室内平面图图像数据集,包含5000个样本,每个样本标注了超过80个室内元素类别。该数据集通过使用多边形进行密集和多样的标注,以区分不同的对象。创建过程中,数据集从15000张图像中精选并由专家人工标注,确保了标注的准确性和一致性。CubiCasa5K广泛应用于自动室内平面图图像分析,特别是在3D房地产虚拟游览和基于平面图的3D模型创建等领域,旨在解决从栅格化平面图中恢复结构和语义信息的问题。

CubiCasa5K is a large-scale floor plan image dataset co-developed by Aalto University and CubiCasa, Inc. It comprises 5,000 samples, each annotated with more than 80 categories of indoor elements. This dataset utilizes dense and diverse polygon-based annotations to differentiate between distinct objects. During its development, the dataset was curated from 15,000 images and manually annotated by domain experts, ensuring annotation accuracy and consistency. CubiCasa5K is widely applied in automated floor plan image analysis, particularly in fields such as 3D real estate virtual tours and floor plan-based 3D model generation, aiming to address the challenge of recovering structural and semantic information from rasterized floor plans.
提供机构:
阿尔托大学
创建时间:
2019-04-03
搜集汇总
数据集介绍
main_image_url
构建方式
CubiCasa5K 数据集的构建方式是通过从 15,000 张芬兰地区的楼面图图像中筛选和审查 5,000 张人工标注的楼面图。这些楼面图被分为三个子类别:高质量建筑、高质量和彩色。为了训练强大的机器学习模型,数据集被随机分为训练集、验证集和测试集。每个楼面图的标注都是以 SVG 向量图形格式进行的,包含对应楼面图中所有元素的结构和几何标注。
特点
CubiCasa5K 数据集的特点是它包含 5,000 个样本,并标注为超过 80 个楼面图对象类别。这些标注是通过使用多边形来分离不同的对象,以密集和多样化的方式进行。与基于强启发式和低级像素操作的古典方法不同,CubiCasa5K 使用了一种改进的多任务卷积神经网络方法。该数据集的发布显著推动了自动楼面图图像分析的研究,因为它为更全面地研究该问题提供了更丰富的工具集。
使用方法
CubiCasa5K 数据集的使用方法是通过将数据集随机分为训练集、验证集和测试集,并使用改进的多任务卷积神经网络进行训练。该网络采用 ResNet-152 预训练模型,并使用多任务学习方案,包括分割和定位任务。通过使用多任务不确定损失,网络可以自动调整每个任务的相对权重,从而减少超参数调整的需要。数据集和训练模型的代码已在 GitHub 上发布,以便于研究人员复现结果。
背景与挑战
背景概述
在建筑室内布局理解和建模的领域,以及随着AR/VR技术的进步,自动解析楼层平面图的需求日益增长。然而,目前缺乏具有代表性的数据集来进一步研究这个问题。为了解决这个问题,本文提出了一种名为CubiCasa5K的新型图像数据集,这是一个包含5000个样本的大规模楼层平面图图像数据集,这些样本被标注为超过80个楼层平面图对象类别。数据集的标注是通过使用多边形来分离不同的对象,以密集和多方面的方式进行。该研究显著推动了自动楼层平面图图像分析的研究,因为它为更全面地研究这个问题提供了更丰富的工具。
当前挑战
CubiCasa5K数据集面临的挑战主要包括:1) 在图像分类、语义分割等领域,数据集的规模通常远远大于CubiCasa5K,因此如何有效地利用现有数据并提高模型的泛化能力是一个挑战;2) 构建过程中,如何确保数据标注的准确性和一致性也是一个挑战;3) 在模型训练过程中,如何有效地利用多任务学习并自动调整任务间的权重也是一个挑战。
常用场景
经典使用场景
CubiCasa5K数据集在建筑室内设计和自动文档分析领域扮演了关键角色,为自动解析平面图图像提供了丰富的训练资源。该数据集包含5000个样本,涵盖了超过80种平面图对象类别,并使用多边形进行密集标注。这使得CubiCasa5K成为研究自动平面图图像分析的重要工具,通过提供更为详尽的数据集,推动了该领域的研究进展。
实际应用
CubiCasa5K数据集在实际应用中展现了巨大的潜力,尤其在房地产虚拟展示、3D模型创建等领域。通过对平面图图像的自动解析,CubiCasa5K能够帮助用户快速获取建筑结构信息,为房地产营销、室内设计等场景提供了高效的数据支持。此外,CubiCasa5K的应用还能够提高平面图图像的利用率,为相关领域的创新应用提供了可能。
衍生相关工作
CubiCasa5K数据集的发布,不仅促进了自动平面图图像分析领域的研究,还衍生出了一系列相关研究。例如,基于CubiCasa5K数据集的改进多任务卷积神经网络模型,在平面图图像分析方面取得了突破性进展。此外,CubiCasa5K数据集还为其他相关研究提供了重要的数据基础,推动了计算机视觉和自动文档分析领域的进一步发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作