GeoBiked

Name: GeoBiked
Creator: 宝马集团，奥格斯堡大学
Published: 2024-09-25 23:57:59
License: 暂无描述

arXiv2024-09-25 更新2024-09-27 收录

下载链接：

https://anonymous.4open.science/r/GeoBIKED-D12C

下载链接

链接失效反馈

官方服务：

资源简介：

GeoBiked数据集由宝马集团和奥格斯堡大学创建，包含4355张自行车图像，这些图像带有结构和技术特征的注释。数据集旨在支持工程设计中的深度生成模型（DGMs），通过自动化标签技术提高数据标注效率。数据集内容包括19种不同自行车风格的分类、前轮和后轮直径、车架和管尺寸等技术特征，以及12个几何参考点的坐标。创建过程包括从BIKED数据集的4512张图像中筛选和标准化，确保几何一致性。该数据集主要应用于工程设计领域，旨在解决数据驱动设计中的数据稀缺问题，支持模型训练、微调和条件机制的开发。

The GeoBiked dataset, developed by BMW Group and the University of Augsburg, consists of 4355 bicycle images annotated with structural and technical characteristics. It is designed to support deep generative models (DGMs) in engineering design, with the goal of enhancing data annotation efficiency through automated labeling technologies. The dataset covers annotations for 19 distinct bicycle style categories, technical features including front and rear wheel diameters, frame and tube dimensions, as well as coordinates of 12 geometric reference points. Its construction involved screening and standardization from 4512 images sourced from the BIKED dataset to ensure geometric consistency. Primarily applied in the engineering design domain, this dataset addresses the data scarcity problem in data-driven design, and supports model training, fine-tuning, and the development of conditional mechanisms.

提供机构：

宝马集团，奥格斯堡大学

创建时间：

2024-09-25

搜集汇总

数据集介绍

构建方式

GeoBiked数据集的构建基于BIKED项目，通过视觉检查和几何归一化处理，从原始的4512张自行车图像中筛选出4355张高质量样本。这些图像经过几何特征的标注，包括12个几何参考点，以确保数据集在结构和几何信息上的丰富性和一致性。此外，数据集还通过GPT-4o等视觉语言模型自动生成多样化的文本描述，进一步丰富了数据集的语义信息。

特点

GeoBiked数据集的显著特点在于其高度的结构和几何信息丰富性，适用于深度生成模型在工程设计中的应用。数据集包含了4355张自行车图像，每张图像都标注了12个几何参考点，以及详细的设计和技术特征。此外，通过GPT-4o生成的多样化文本描述，使得数据集在语义层面也具有高度的多样性和准确性。

使用方法

GeoBiked数据集可用于训练和微调深度生成模型，特别是在工程设计领域。用户可以通过该数据集进行模型验证、条件控制机制的开发以及预训练模型的评估。例如，可以训练卷积变分自编码器（VAE）、扩散模型（DDIM）和潜在扩散模型（LDM）等，以生成高质量的结构图像。此外，数据集还可用于评估视觉语言模型在处理技术图像时的理解和描述能力。

背景与挑战

背景概述

GeoBiked数据集由BMW集团和奥格斯堡大学的研究人员于2024年创建，旨在推动工程设计领域中深度生成模型（DGMs）的应用。该数据集包含了4355张自行车图像，并注释了结构和技术特征，旨在解决工程设计中缺乏详细结构和几何信息的数据集问题。GeoBiked不仅填补了这一空白，还通过自动化标签技术，利用大规模基础模型，显著降低了数据标注的门槛，为工程师和设计师提供了进行模型训练、微调、条件机制开发和基准测试的基础数据。

当前挑战

GeoBiked数据集面临的挑战主要集中在两个方面：一是解决工程设计领域中缺乏详细结构和几何信息的数据集问题，这限制了深度生成模型在该领域的应用；二是构建过程中遇到的自动化标签挑战，尽管利用了大规模基础模型，但如何确保标签的准确性和多样性仍然是一个复杂的问题。此外，如何平衡生成描述的创造性和准确性，以及如何优化系统提示以避免模型幻觉，也是当前需要解决的关键问题。

常用场景

经典使用场景

GeoBiked数据集在工程设计领域中被广泛用于深度生成模型（DGMs）的训练与微调。其经典使用场景包括通过图像生成模型检测几何对应关系，如车轮中心位置的识别，以及生成多样化的文本描述以辅助结构图像的分析。这些应用场景不仅提升了模型的几何理解能力，还增强了其在工程设计中的实际应用价值。

衍生相关工作

基于GeoBiked数据集，研究者们开发了多种相关工作，包括利用扩散模型进行几何特征检测和通过视觉语言模型生成文本描述。这些工作不仅验证了基础模型的有效性，还推动了工程设计领域中AI驱动的创新。例如，Luo等人的研究展示了如何利用扩散超特征进行几何对应关系的检测，而GPT-4o的应用则展示了生成多样化文本描述的潜力。

数据集最近研究