Oxford Flowers
收藏github2023-12-29 更新2024-05-31 收录
下载链接:
https://github.com/EBGU/Rectified_Flow
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于训练和测试模型,需要手动分割数据,并提供了numpy版本的标签。
This dataset is utilized for training and testing models, requiring manual segmentation of the data, and provides labels in numpy format.
创建时间:
2023-12-25
原始信息汇总
数据集概述
数据集名称
Rectified Flow
数据集来源
基于论文Rectified Flow的复现,使用PyTorch和U-ViT实现。
数据集内容
- 训练数据:使用Oxford Flowers数据集,需手动分割数据,数据集标签以numpy格式存储。
- 预训练权重:提供预训练模型权重,可从Google Drive下载。
使用方法
- 训练:通过修改yaml文件并运行
python multi_gpu_trainer.py example进行模型训练。 - 推理:
- 使用预训练权重:运行
python sample_img.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --n_sqrt 16 --steps 200。 - 使用ODE solver:安装
torchdiffeq后运行python sample_img_ODESolver.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --n_sqrt 16 --rtol 0.001。
- 使用预训练权重:运行
- 图像插值:运行
python image_interpolation.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --input_image images/image1.jpg --target_image images/image2.jpg --rtol 0.0001 --mix_depth -0.02 --spherical True。注意,此功能目前处于实验阶段,效果不佳。
参数说明
- 设备:通常为cuda:0。
- 加载:选择最佳或最后epoch的模型。
- 保存目录:图像保存位置。
- 实验配置:yaml格式的实验配置文件。
- n_sqrt:每个类别生成N^2个样本。
- 步骤:采样步骤数,建议200步。
- rtol:每步可接受的相对误差,建议1e-3。
搜集汇总
数据集介绍

构建方式
Oxford Flowers数据集的构建基于VGG团队的研究成果,涵盖了102种不同花卉的图像数据。每类花卉包含40至258张图像,总计超过8000张高分辨率图片。数据集的构建过程包括从公开资源中收集花卉图像,并通过手动标注确保每张图像的类别准确性。为了便于模型训练,数据集还提供了对应的标签文件,以numpy格式存储,便于直接加载和使用。
使用方法
使用Oxford Flowers数据集时,首先需要手动将训练数据进行划分,确保训练集、验证集和测试集的合理分布。数据集提供了numpy格式的标签文件,可直接用于模型训练。在训练过程中,用户可以通过修改yaml配置文件来调整模型参数。推理阶段,用户可以选择使用预训练权重或通过ODE求解器进行图像生成。推理过程支持多种参数设置,如设备选择、采样步数和相对误差容限等,以满足不同实验需求。
背景与挑战
背景概述
Oxford Flowers数据集由牛津大学视觉几何组(Visual Geometry Group, VGG)于2008年创建,旨在为计算机视觉领域的研究提供高质量的图像分类基准。该数据集包含102种英国常见花卉的图像,每类包含40至258张图像,总计超过8000张。这些图像在尺度、姿态和光照条件上具有显著的多样性,为图像分类、识别和生成任务提供了丰富的实验数据。Oxford Flowers数据集在深度学习领域具有广泛的影响力,尤其是在细粒度图像分类任务中,成为评估模型性能的重要基准之一。
当前挑战
Oxford Flowers数据集在应用过程中面临多重挑战。首先,细粒度图像分类任务要求模型能够区分高度相似的花卉类别,这对特征提取和分类器的设计提出了极高的要求。其次,数据集中图像的多样性和复杂性,如不同光照、姿态和背景,增加了模型训练的难度。在数据构建过程中,研究人员需手动标注大量图像,确保标签的准确性和一致性,这一过程耗时且容易出错。此外,数据集的规模相对较小,可能限制了深度学习模型的泛化能力,需要通过数据增强等技术来弥补。
常用场景
经典使用场景
Oxford Flowers数据集在计算机视觉领域被广泛用于图像分类和识别任务。该数据集包含了102种不同花卉的高质量图像,每类花卉包含40至258张图片,总计超过8000张图像。这些图像经过精心标注,为研究者提供了一个标准化的测试平台,用于评估和比较不同图像分类算法的性能。
解决学术问题
Oxford Flowers数据集解决了图像分类中的多类别识别问题,尤其是在花卉识别这一特定领域。通过提供大量标注数据,该数据集帮助研究者开发出更精确的分类模型,推动了深度学习在图像识别中的应用。此外,该数据集还促进了迁移学习和数据增强技术的研究,为小样本学习提供了宝贵的资源。
实际应用
在实际应用中,Oxford Flowers数据集被广泛用于开发智能花卉识别系统,这些系统可以应用于植物学研究和园艺管理。例如,植物学家可以利用这些系统快速识别和分类野外采集的花卉样本,而园艺爱好者则可以通过手机应用识别花园中的植物种类,获取相关的养护知识。
数据集最近研究
最新研究方向
在计算机视觉领域,Oxford Flowers数据集作为花卉图像分类的基准数据集,近年来在生成模型和图像插值技术的研究中展现出新的应用潜力。基于Rectified Flow和U-ViT架构的研究,研究者们探索了如何利用该数据集进行高效的图像生成与插值。通过多GPU训练和ODE求解器的结合,模型能够在较少的采样步骤内生成高质量的图像,显著提升了生成效率。尽管图像插值功能尚处于实验阶段,但其在图像编辑和风格迁移等应用中的前景令人期待。这些研究不仅推动了生成模型的技术进步,也为花卉图像的自动化处理提供了新的思路。
以上内容由遇见数据集搜集并总结生成



