LSUN-Stanford car dataset

github2024-03-22 更新2024-05-31 收录

下载链接：

https://github.com/Tin-Kramberger/LSUN-Stanford-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

目前没有公开可用的足够数据集，可用于训练生成对抗网络（GAN）的汽车图像。所有可用的汽车数据集在噪声、姿态和缩放级别上都有所不同。因此，本工作的目标是创建一个改进的汽车图像数据集，该数据集更适合GAN训练。为了提高GAN的性能，我们将LSUN和Stanford汽车数据集结合起来。然后修剪新的合并数据集，以调整缩放级别并减少图像噪声。这个过程导致用于训练的图像数量减少，但质量提高。修剪后的数据集通过使用原始设置训练StyleGAN进行评估。修剪合并的LSUN和Stanford数据集后，得到了2,067,710张噪声较少、缩放级别更调整的汽车图像。使用Fréchet Inception Distance（FID）作为指标，在LSUN-Stanford汽车数据集上训练的StyleGAN比仅使用LSUN数据集训练的StyleGAN高出3.7%。结果表明，提出的LSUN-Stanford汽车数据集比其他目前可用的大型汽车数据集更一致，更适合训练GAN神经网络。

Currently, there is no publicly available dataset sufficient for training Generative Adversarial Networks (GANs) on car images. All available car datasets vary in terms of noise, pose, and scale levels. Therefore, the objective of this work is to create an improved car image dataset that is more suitable for GAN training. To enhance the performance of GANs, we combined the LSUN and Stanford car datasets. The newly merged dataset was then pruned to adjust the scale levels and reduce image noise. This process resulted in a reduction in the number of images available for training but an improvement in quality. The pruned dataset was evaluated by training StyleGAN using the original settings. After pruning and merging the LSUN and Stanford datasets, we obtained 2,067,710 car images with less noise and more adjusted scale levels. Using the Fréchet Inception Distance (FID) as a metric, the StyleGAN trained on the LSUN-Stanford car dataset outperformed the StyleGAN trained solely on the LSUN dataset by 3.7%. The results indicate that the proposed LSUN-Stanford car dataset is more consistent and better suited for training GAN neural networks than other currently available large car datasets.

创建时间：

2019-10-04

原始信息汇总

数据集名称

LSUN-Stanford Car Dataset

数据集描述

该数据集是通过合并LSUN和Stanford Car数据集并进行修剪而创建的，旨在提供一个更适合于生成对抗网络（GAN）训练的car图像数据集。修剪过程调整了图像的缩放级别并减少了噪声，最终形成了包含2,067,710张图像的数据集。该数据集在StyleGAN训练中表现优于仅使用LSUN数据集，通过Fréchet Inception Distance (FID) 指标提升了3.7%。

数据集用途

主要用于训练生成对抗网络（GAN），特别是StyleGAN。

数据集大小

包含2,067,710张图像。

数据集来源

合并自LSUN和Stanford Car数据集。

数据集引用信息

@article{KrambergerPotocnik2020, author = {Kramberger, Tin and Potočnik, Božidar}, Title = {LSUN-Stanford Car Dataset: Enhancing Large-Scale Car Image Datasets Using Deep Learning for Usage in GAN Training}, issn = {2076-3417}, journal = {Applied Sciences}, Year = {2020}, month = {jul}, number = {14}, publisher = {Multidisciplinary Digital Publishing Institute}, volume = {10}, doi = {10.3390/app10144913}, url = {https://www.mdpi.com/2076-3417/10/14/4913} }

数据集获取方式

数据集资源可通过Google Drive链接获取：Google Drive链接。

搜集汇总

数据集介绍

构建方式

LSUN-Stanford car dataset的构建旨在为生成对抗网络（GAN）的训练提供一个高质量的汽车图像数据集。该数据集通过整合LSUN和Stanford car两个现有数据集，并对其进行优化处理而成。具体而言，研究人员首先将两个数据集进行合并，随后通过裁剪和去噪等操作，调整图像的缩放比例并减少噪声，最终筛选出2,067,710张高质量的汽车图像。这一过程显著提升了数据集的整体质量，使其更适合用于GAN的训练。

特点

LSUN-Stanford car dataset的主要特点在于其高质量和一致性。相较于其他现有的汽车图像数据集，该数据集经过精心优化，减少了噪声并调整了图像的缩放比例，从而提供了更加清晰和统一的图像资源。此外，数据集的规模庞大，包含超过200万张图像，能够为深度学习模型提供丰富的训练样本。实验表明，使用该数据集训练的StyleGAN在Fréchet Inception Distance（FID）指标上表现优于仅使用LSUN数据集训练的模型，证明了其在GAN训练中的优越性。

使用方法

使用LSUN-Stanford car dataset时，首先需要从指定链接下载LSUN和Stanford car数据集，并将其导出到指定文件夹中。随后，从Google Drive下载并导入MySQL数据库，以便管理数据集。最后，通过提供的Python脚本对图像进行裁剪和导出，生成符合需求的训练样本。用户可以根据具体需求调整图像的尺寸和其他参数，确保数据集能够满足不同深度学习任务的要求。

背景与挑战

背景概述

LSUN-Stanford car dataset 是由 Tin Kramberger 和 Božidar Potočnik 于2020年创建的一个专为生成对抗网络（GAN）训练优化的汽车图像数据集。该数据集结合了LSUN和Stanford car数据集，通过深度学习技术对图像进行筛选和优化，旨在解决现有汽车图像数据集在噪声、姿态和缩放水平上的不一致性问题。通过合并和修剪，最终生成了包含2,067,710张高质量汽车图像的数据集，显著提升了GAN的训练效果。该数据集在《Applied Sciences》期刊上发表，并已被广泛应用于计算机视觉和生成模型的研究中，推动了相关领域的技术进步。

当前挑战

LSUN-Stanford car dataset 的构建面临多重挑战。首先，现有汽车图像数据集在噪声、姿态和缩放水平上的不一致性严重影响了GAN的训练效果，如何有效整合和优化这些数据成为核心问题。其次，在数据集构建过程中，需要对大量图像进行筛选和修剪，以确保图像质量的一致性，这一过程不仅耗时且对计算资源要求较高。此外，如何在不损失图像多样性的前提下提升数据集的整体质量，也是构建过程中需要解决的关键问题。这些挑战的克服为后续研究提供了高质量的数据支持，同时也为类似数据集的构建提供了宝贵经验。

常用场景

经典使用场景

LSUN-Stanford car dataset在生成对抗网络（GAN）的训练中展现了其独特的价值。通过结合LSUN和Stanford car数据集，该数据集提供了高质量、低噪声的汽车图像，特别适用于GAN模型的训练。研究人员利用该数据集进行StyleGAN的训练，显著提升了生成图像的质量，证明了其在GAN训练中的优越性。

解决学术问题

LSUN-Stanford car dataset解决了现有汽车图像数据集在噪声、姿态和缩放水平上的不一致性问题。通过合并和修剪两个数据集，研究人员成功创建了一个更适合GAN训练的高质量数据集。这一改进显著提升了GAN模型的性能，尤其是在Fréchet Inception Distance（FID）指标上，相较于仅使用LSUN数据集，性能提升了3.7%。

衍生相关工作

LSUN-Stanford car dataset的发布催生了一系列相关研究工作，特别是在GAN模型优化和汽车图像生成领域。许多研究基于该数据集进行了进一步的实验和改进，提出了新的模型架构和训练策略，推动了生成对抗网络在汽车图像处理中的应用和发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集