DVM-CAR

Name: DVM-CAR
Creator: 格拉斯哥大学计算科学学院
Published: 2023-01-09 23:36:23
License: 暂无描述

arXiv2023-01-09 更新2024-06-21 收录

下载链接：

https://deepvisualmarketing.github.io

下载链接

链接失效反馈

官方服务：

资源简介：

DVM-CAR数据集是由格拉斯哥大学计算科学学院等机构联合创建的大型汽车数据集，旨在支持视觉营销研究和应用。该数据集包含140万张来自899种不同汽车模型的图像，以及这些车型在英国市场超过十年的规格和销售信息。数据集的创建过程涉及从多个在线源收集数据，并通过机器学习技术进行清洗和整合。DVM-CAR数据集的应用领域广泛，包括汽车外观设计、消费者分析和销售预测等，为汽车行业的研究和市场预测提供了有力的数据支持。

The DVM-CAR dataset is a large-scale automotive dataset jointly created by the School of Computing Science at the University of Glasgow and other institutions, aiming to support visual marketing research and applications. This dataset contains 1.4 million images covering 899 distinct car models, along with over a decade of specifications and sales information for these vehicle models in the UK market. The dataset's creation process involves collecting data from multiple online sources, followed by cleaning and integration using machine learning techniques. The DVM-CAR dataset has a wide range of application scenarios, including automotive exterior design, consumer analysis, sales forecasting and more, providing robust data support for research and market forecasting in the automotive industry.

提供机构：

格拉斯哥大学计算科学学院

创建时间：

2021-08-10

搜集汇总

数据集介绍

构建方式

在汽车工业与视觉营销研究日益交融的背景下，DVM-CAR数据集的构建体现了多源数据融合的前沿理念。该数据集通过系统化采集英国市场十余年的在线信息，整合了汽车分类广告平台、车辆注册机构以及汽车评测网站等多渠道数据。构建过程中，研究团队运用了Mask R-CNN等机器学习技术进行隐私信息处理与图像质量筛选，通过预训练的卷积神经网络对超过六百万张原始图像进行视角分类与背景去除，最终保留了145万张符合八种标准视角的高质量车辆图像。同时，非视觉数据经过清洗与融合，形成了包含规格、销售、价格等多维属性的结构化表格，并通过唯一标识符实现跨表关联，构建出一个层次清晰、易于扩展的关系型数据库。

特点

DVM-CAR数据集以其规模宏大与内容全面而著称，涵盖了899种车型的145万张图像及对应的规格与销售数据，充分满足大数据在体量、多样性、时效性与真实性方面的特征。该数据集独特之处在于首次将车辆外观图像、详细技术参数与长期市场销售记录进行深度融合，为视觉营销与产品设计研究提供了前所未有的多模态数据基础。其图像数据均经过标准化处理，移除背景并统一视角，显著提升了视觉特征的提取效率；表格数据采用关系型结构设计，支持灵活的数据关联与查询，极大增强了跨学科研究的可操作性。

使用方法

该数据集为跨学科研究提供了丰富的数据支撑，尤其适用于汽车外观美学分析、消费者行为研究与销售预测等领域。研究人员可通过其公开的GitHub页面获取数据，并依据提供的图像索引表与关系型表格进行高效的数据定位与整合。在具体应用中，视觉数据可用于训练深度学习模型以提取设计特征或生成新颖车型设计，例如通过微调预训练CNN模型预测车型的现代性评分；非视觉数据则支持计量经济分析，如探究设计美学与市场表现之间的关联。数据集采用CC BY-NC许可，鼓励非商业目的的研究使用，并通过清晰的数据结构设计降低了使用门槛，助力商业分析与计算机视觉研究的协同创新。

背景与挑战

背景概述

随着产品美学分析与设计在商业与计算机科学交叉领域日益受到关注，汽车行业作为全球重要的工业经济力量，其外观设计、消费者分析与销售预测等研究需求不断增长。然而，由于企业通常保密产品销售等商业细节，公开可用的涵盖多变量信息的大规模数据集极为匮乏，这严重制约了相关研究的进展。在此背景下，由格拉斯哥大学、南加州大学等机构的研究人员于2023年联合创建了DVM-CAR数据集，旨在通过整合网络多源数据，构建一个包含140万张图像、899款车型及其十余年规格与销售信息的综合性汽车数据集，以支持视觉营销、经济分析与预测应用，填补了该领域大规模公开数据的空白。

当前挑战

DVM-CAR数据集致力于解决汽车视觉营销领域中的核心挑战，即如何将产品外观设计、规格属性与市场表现进行关联分析，以优化汽车外观美学并预测销售趋势。这一领域问题面临数据覆盖不全、多模态信息融合困难等挑战。在数据集构建过程中，研究人员遭遇了多重技术障碍：首先，需从在线分类广告平台、车辆管理机构等多源异构数据中采集并清洗图像与非视觉信息，确保数据的一致性与完整性；其次，为遵守通用数据保护条例，必须运用机器学习技术检测并移除图像中的隐私信息，如车牌模糊化处理；此外，还需通过预训练卷积神经网络过滤非外观视角图像，统一模糊数据值，并将信息聚合至模型层级，以构建研究者友好的分层数据结构。

常用场景

经典使用场景

在汽车视觉营销研究领域，DVM-CAR数据集为学者提供了大规模、多模态的数据支持，其经典使用场景集中于汽车外观美学分析与设计优化。通过整合超过140万张车辆图像、车型规格及销售数据，研究者能够深入探究汽车外观特征与市场表现之间的关联。例如，利用深度学习模型从图像中提取视觉属性，评估设计现代性评分，并结合销售记录分析设计趋势对消费者偏好的影响。这一场景不仅推动了产品美学量化研究的发展，也为跨学科合作搭建了坚实的实证基础。

实际应用

在实际应用层面，DVM-CAR数据集为汽车制造商、经销商及营销策略制定者提供了数据驱动的决策支持。通过分析历史销售数据与车辆外观图像，企业能够识别设计趋势，预测市场反应，并优化新产品的外观开发。例如，利用生成对抗网络（GAN）基于数据集训练模型，可以生成符合消费者偏好的创新设计草图；同时，结合时间序列分析，能够评估设计变更对市场份额的潜在影响，从而降低产品开发风险，提升市场竞争力。

衍生相关工作

DVM-CAR数据集的发布催生了一系列相关经典研究，尤其是在视觉设计生成与销售预测领域。例如，基于该数据集训练的CycleGAN模型被用于生成具有生物启发特征的汽车前脸设计，探索拟人化外观的市场吸引力；同时，结合卷积神经网络（CNN）与循环神经网络（RNN）的混合模型，实现了从设计美学评分到销售变化的端到端预测。这些工作不仅拓展了生成式人工智能在工业设计中的应用，也为数据驱动的营销分析提供了新范式，推动了学术与产业界的深度融合。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集