five

Oxford Flowers|花卉识别数据集|机器学习数据集

收藏
github2023-12-29 更新2024-05-31 收录
花卉识别
机器学习
下载链接:
https://github.com/EBGU/Rectified_Flow
下载链接
链接失效反馈
资源简介:
该数据集用于训练和测试模型,需要手动分割数据,并提供了numpy版本的标签。

This dataset is utilized for training and testing models, requiring manual segmentation of the data, and provides labels in numpy format.
创建时间:
2023-12-25
原始信息汇总

数据集概述

数据集名称

Rectified Flow

数据集来源

基于论文Rectified Flow的复现,使用PyTorch和U-ViT实现。

数据集内容

  • 训练数据:使用Oxford Flowers数据集,需手动分割数据,数据集标签以numpy格式存储。
  • 预训练权重:提供预训练模型权重,可从Google Drive下载。

使用方法

  • 训练:通过修改yaml文件并运行python multi_gpu_trainer.py example进行模型训练。
  • 推理
    • 使用预训练权重:运行python sample_img.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --n_sqrt 16 --steps 200
    • 使用ODE solver:安装torchdiffeq后运行python sample_img_ODESolver.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --n_sqrt 16 --rtol 0.001
  • 图像插值:运行python image_interpolation.py --device "cuda:0" --load "last" --SavedDir tmp/ --ExpConfig example/example.yaml --input_image images/image1.jpg --target_image images/image2.jpg --rtol 0.0001 --mix_depth -0.02 --spherical True。注意,此功能目前处于实验阶段,效果不佳。

参数说明

  • 设备:通常为cuda:0。
  • 加载:选择最佳或最后epoch的模型。
  • 保存目录:图像保存位置。
  • 实验配置:yaml格式的实验配置文件。
  • n_sqrt:每个类别生成N^2个样本。
  • 步骤:采样步骤数,建议200步。
  • rtol:每步可接受的相对误差,建议1e-3。
AI搜集汇总
数据集介绍
main_image_url
构建方式
Oxford Flowers数据集的构建基于VGG团队的研究成果,涵盖了102种不同花卉的图像数据。每类花卉包含40至258张图像,总计超过8000张高分辨率图片。数据集的构建过程包括从公开资源中收集花卉图像,并通过手动标注确保每张图像的类别准确性。为了便于模型训练,数据集还提供了对应的标签文件,以numpy格式存储,便于直接加载和使用。
使用方法
使用Oxford Flowers数据集时,首先需要手动将训练数据进行划分,确保训练集、验证集和测试集的合理分布。数据集提供了numpy格式的标签文件,可直接用于模型训练。在训练过程中,用户可以通过修改yaml配置文件来调整模型参数。推理阶段,用户可以选择使用预训练权重或通过ODE求解器进行图像生成。推理过程支持多种参数设置,如设备选择、采样步数和相对误差容限等,以满足不同实验需求。
背景与挑战
背景概述
Oxford Flowers数据集由牛津大学视觉几何组(Visual Geometry Group, VGG)于2008年创建,旨在为计算机视觉领域的研究提供高质量的图像分类基准。该数据集包含102种英国常见花卉的图像,每类包含40至258张图像,总计超过8000张。这些图像在尺度、姿态和光照条件上具有显著的多样性,为图像分类、识别和生成任务提供了丰富的实验数据。Oxford Flowers数据集在深度学习领域具有广泛的影响力,尤其是在细粒度图像分类任务中,成为评估模型性能的重要基准之一。
当前挑战
Oxford Flowers数据集在应用过程中面临多重挑战。首先,细粒度图像分类任务要求模型能够区分高度相似的花卉类别,这对特征提取和分类器的设计提出了极高的要求。其次,数据集中图像的多样性和复杂性,如不同光照、姿态和背景,增加了模型训练的难度。在数据构建过程中,研究人员需手动标注大量图像,确保标签的准确性和一致性,这一过程耗时且容易出错。此外,数据集的规模相对较小,可能限制了深度学习模型的泛化能力,需要通过数据增强等技术来弥补。
常用场景
经典使用场景
Oxford Flowers数据集在计算机视觉领域被广泛用于图像分类和识别任务。该数据集包含了102种不同花卉的高质量图像,每类花卉包含40至258张图片,总计超过8000张图像。这些图像经过精心标注,为研究者提供了一个标准化的测试平台,用于评估和比较不同图像分类算法的性能。
解决学术问题
Oxford Flowers数据集解决了图像分类中的多类别识别问题,尤其是在花卉识别这一特定领域。通过提供大量标注数据,该数据集帮助研究者开发出更精确的分类模型,推动了深度学习在图像识别中的应用。此外,该数据集还促进了迁移学习和数据增强技术的研究,为小样本学习提供了宝贵的资源。
实际应用
在实际应用中,Oxford Flowers数据集被广泛用于开发智能花卉识别系统,这些系统可以应用于植物学研究和园艺管理。例如,植物学家可以利用这些系统快速识别和分类野外采集的花卉样本,而园艺爱好者则可以通过手机应用识别花园中的植物种类,获取相关的养护知识。
数据集最近研究
最新研究方向
在计算机视觉领域,Oxford Flowers数据集作为花卉图像分类的基准数据集,近年来在生成模型和图像插值技术的研究中展现出新的应用潜力。基于Rectified Flow和U-ViT架构的研究,研究者们探索了如何利用该数据集进行高效的图像生成与插值。通过多GPU训练和ODE求解器的结合,模型能够在较少的采样步骤内生成高质量的图像,显著提升了生成效率。尽管图像插值功能尚处于实验阶段,但其在图像编辑和风格迁移等应用中的前景令人期待。这些研究不仅推动了生成模型的技术进步,也为花卉图像的自动化处理提供了新的思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

PlantVillage

在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录