Oxford Flowers

github2023-12-29 更新2024-05-31 收录

下载链接：

https://github.com/EBGU/Rectified_Flow

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于训练和测试模型，需要手动分割数据，并提供了numpy版本的标签。

This dataset is utilized for training and testing models, requiring manual segmentation of the data, and provides labels in numpy format.

创建时间：

2023-12-25

原始信息汇总

数据集概述

数据集名称

Rectified Flow

数据集来源

基于论文Rectified Flow的复现，使用PyTorch和U-ViT实现。

数据集内容

训练数据：使用Oxford Flowers数据集，需手动分割数据，数据集标签以numpy格式存储。
预训练权重：提供预训练模型权重，可从Google Drive下载。

使用方法

训练：通过修改yaml文件并运行python multi_gpu_trainer.py example进行模型训练。
推理：
- 使用预训练权重：运行python sample_img.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --n_sqrt 16 --steps 200。
- 使用ODE solver：安装torchdiffeq后运行python sample_img_ODESolver.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --n_sqrt 16 --rtol 0.001。
图像插值：运行python image_interpolation.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --input_image images/image1.jpg --target_image images/image2.jpg --rtol 0.0001 --mix_depth -0.02 --spherical True。注意，此功能目前处于实验阶段，效果不佳。

参数说明

设备：通常为cuda:0。
加载：选择最佳或最后epoch的模型。
保存目录：图像保存位置。
实验配置：yaml格式的实验配置文件。
n_sqrt：每个类别生成N^2个样本。
步骤：采样步骤数，建议200步。
rtol：每步可接受的相对误差，建议1e-3。

搜集汇总

数据集介绍

构建方式

Oxford Flowers数据集的构建基于VGG团队的研究成果，涵盖了102种不同花卉的图像数据。每类花卉包含40至258张图像，总计超过8000张高分辨率图片。数据集的构建过程包括从公开资源中收集花卉图像，并通过手动标注确保每张图像的类别准确性。为了便于模型训练，数据集还提供了对应的标签文件，以numpy格式存储，便于直接加载和使用。

使用方法

使用Oxford Flowers数据集时，首先需要手动将训练数据进行划分，确保训练集、验证集和测试集的合理分布。数据集提供了numpy格式的标签文件，可直接用于模型训练。在训练过程中，用户可以通过修改yaml配置文件来调整模型参数。推理阶段，用户可以选择使用预训练权重或通过ODE求解器进行图像生成。推理过程支持多种参数设置，如设备选择、采样步数和相对误差容限等，以满足不同实验需求。

背景与挑战

背景概述

Oxford Flowers数据集由牛津大学视觉几何组（Visual Geometry Group, VGG）于2008年创建，旨在为计算机视觉领域的研究提供高质量的图像分类基准。该数据集包含102种英国常见花卉的图像，每类包含40至258张图像，总计超过8000张。这些图像在尺度、姿态和光照条件上具有显著的多样性，为图像分类、识别和生成任务提供了丰富的实验数据。Oxford Flowers数据集在深度学习领域具有广泛的影响力，尤其是在细粒度图像分类任务中，成为评估模型性能的重要基准之一。

当前挑战

Oxford Flowers数据集在应用过程中面临多重挑战。首先，细粒度图像分类任务要求模型能够区分高度相似的花卉类别，这对特征提取和分类器的设计提出了极高的要求。其次，数据集中图像的多样性和复杂性，如不同光照、姿态和背景，增加了模型训练的难度。在数据构建过程中，研究人员需手动标注大量图像，确保标签的准确性和一致性，这一过程耗时且容易出错。此外，数据集的规模相对较小，可能限制了深度学习模型的泛化能力，需要通过数据增强等技术来弥补。

常用场景

经典使用场景

Oxford Flowers数据集在计算机视觉领域被广泛用于图像分类和识别任务。该数据集包含了102种不同花卉的高质量图像，每类花卉包含40至258张图片，总计超过8000张图像。这些图像经过精心标注，为研究者提供了一个标准化的测试平台，用于评估和比较不同图像分类算法的性能。

解决学术问题

Oxford Flowers数据集解决了图像分类中的多类别识别问题，尤其是在花卉识别这一特定领域。通过提供大量标注数据，该数据集帮助研究者开发出更精确的分类模型，推动了深度学习在图像识别中的应用。此外，该数据集还促进了迁移学习和数据增强技术的研究，为小样本学习提供了宝贵的资源。

实际应用

在实际应用中，Oxford Flowers数据集被广泛用于开发智能花卉识别系统，这些系统可以应用于植物学研究和园艺管理。例如，植物学家可以利用这些系统快速识别和分类野外采集的花卉样本，而园艺爱好者则可以通过手机应用识别花园中的植物种类，获取相关的养护知识。

数据集最近研究