HPatches|计算机视觉数据集|图像处理数据集

github2017-12-14 更新2024-05-31 收录

计算机视觉

图像处理

下载链接：

https://github.com/Sunshine352/hpatches-dataset

下载链接

链接失效反馈

资源简介：

HPatches数据集包含从多个图像序列中提取的补丁，每个序列包含同一场景的图像。序列根据图像间的变换类型组织，分为光照变化和视角变化两类。每个图像序列提供参考补丁和对应的其他图像补丁，补丁大小为65x65像素。数据集用于评估局部描述符的性能。

The HPatches dataset comprises patches extracted from multiple image sequences, each sequence containing images of the same scene. The sequences are organized based on the type of transformation between images, categorized into illumination changes and viewpoint changes. Each image sequence provides reference patches and corresponding patches from other images, with a patch size of 65x65 pixels. The dataset is utilized for evaluating the performance of local descriptors.

创建时间：

2017-12-14

原始信息汇总

数据集概述

数据集名称

HPatches: Homography-patches dataset

数据集用途

用于评估局部描述符的性能，特别是在光照变化和视角变化下的表现。

数据集结构

序列类型：
- i_X：光照变化序列
- v_X：视角变化序列
文件格式：
- ref.png：参考图像的参考补丁
- eX.png 和 hX.png：其他图像中的对应补丁，其中 e 表示简单，h 表示困难
- 每个补丁大小为 65x65 像素，存储在单个 .png 文件中，补丁沿单列堆叠

补丁提取方法

参考图像与目标图像：
- 每个序列包含一个参考图像和5个目标图像，这些图像在光照和/或视角上有所不同
- 提供每个图像相对于参考图像的地面实况单应性 $H$
补丁提取：
- 使用局部特征提取器（Hessian、Harris和DoG检测器）在参考图像中采样补丁
- 补丁方向通过Lowe的方法估计，不使用仿射适应，所有补丁为方形区域
- 补丁从检测到的特征尺度放大5倍的区域提取，确保完全包含在图像中
- 防止多重检测，超过50%椭圆重叠的多个检测被聚类，随机保留一个

数据集下载

补丁数据集：
- HPatches [4.2GB]
完整图像序列：
- HPatches full sequences [1.3GB]

引用信息

参考文献：
- HPatches: A benchmark and evaluation of handcrafted and learned local descriptors, Vassileios Balntas*, Karel Lenc*, Andrea Vedaldi and Krystian Mikolajczyk, CVPR 2017.

AI搜集汇总

数据集介绍

构建方式

HPatches数据集的构建，是通过从多个图像序列中提取图像块（patches）来进行的。每个序列包含场景的多个图像，并根据图像间变换类型组织成不同文件夹。利用局部特征提取器（Hessian、Harris和DoG检测器）在参考图像中采样图像块，并通过仿射抖动来模拟常见局部特征检测器的几何重复性误差，生成易于识别和难以识别的图像块。

特点

该数据集的特点在于，它提供了一个评估局部描述符性能的基准。数据集中的图像块按照场景变换类型分类，包括光照变化和视点变化。每个图像块都经过精心设计，以模拟真实场景中的几何噪声，并提供了相应的真实仿射变换矩阵，使得该数据集在局部特征描述符的评价中具有较高的参考价值。

使用方法

使用HPatches数据集时，用户可以通过提供的自动化脚本下载所需的全部数据文件。此外，数据集的使用者可以直接从提供的tar文件中下载和解压图像序列。针对Python和Matlab的示例读取代码已经在hpatches-benchmark仓库中提供，方便用户快速上手。

背景与挑战

背景概述

HPatches数据集，全称为Homography-patches数据集，是一项针对局部图像描述符性能评估的基准数据集。该数据集由Vassileios Balntas、Karel Lenc、Andrea Vedaldi和Krystian Mikolajczyk等研究人员于2017年在CVPR上发表，旨在为图像局部特征描述符的研究与评估提供统一的平台。HPatches数据集包含了多个图像序列，每个序列展现了不同光照变化或视角变化的场景，从而为局部特征描述符的几何变换不变性提供了测试基准。该数据集在计算机视觉领域具有显著影响力，为相关研究提供了重要的实验基础。

当前挑战

HPatches数据集在构建过程中面临的挑战主要包括：确保图像序列中不同光照和视角变化下的特征点匹配准确性，以及如何模拟真实场景中局部特征检测器可能出现的几何重复性误差。数据集通过在参考图像上提取特征点并应用几何噪声（affine jitter）来模拟这一挑战，同时提供了易于处理（easy）和难度较高（hard）两种级别的几何噪声，以评估不同描述符在几何变换下的鲁棒性。此外，数据集的构建还需克服如何准确量化局部描述符性能的问题，为此，配套的评估工具箱定义了任务并实现了HPatches评价协议，以供研究者进行性能比较和分析。

常用场景

经典使用场景

HPatches数据集作为局部特征描述符评估的基准，其经典使用场景在于为研究者提供了一个涵盖多种图像变换的标准化测试平台，以便于在控制条件下评估和比较不同局部特征描述符的性能。该数据集通过其精细设计的图像序列，使得研究者能够在变化的光照和视角条件下，对描述符的几何不变性和光照不变性进行量化分析。

实际应用

在实际应用中，HPatches数据集的应用场景广泛，特别是在计算机视觉和图像处理领域。它被用于指导算法开发，以提升图像匹配、物体识别和场景重建等任务的准确性。此外，该数据集也被用于自动驾驶、增强现实和机器人导航等高科技领域的算法训练和验证。

衍生相关工作

HPatches数据集衍生了众多相关工作，包括但不限于局部特征描述符的学习与优化、图像匹配算法的改进、以及基于该数据集的性能评估方法的创新。这些研究进一步扩展了HPatches的应用范围，推动了计算机视觉领域的技术发展。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据，包括日照时间、降雨量、温度、风速等关键数据。通过这些数据，可以深入了解气象现象对不同地区的影响，并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

CatMeows

该数据集包含440个声音样本，由21只属于两个品种（缅因州库恩猫和欧洲短毛猫）的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定，包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外，还有一个额外的zip文件，包含被排除的录音（非喵声）和未剪辑的连续发声序列。

huggingface 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集，主要由非网络来源的内部数据构成，包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容，质量优异，信息密度可观。数据集适用于预训练或继续预训练用途，未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用，但建议先使用配套的预训练数据集对模型进行继续预训练后，再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据，以避免灾难性遗忘并加强模型表现。

huggingface 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性，12位男性)，以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情，歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常，强烈) 下产生的，另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位，48kHz .wav)，音频-视频 (720p H.264，AAC 48kHz，.mp4) 和仅视频 (无声音)。注意，Actor_18没有歌曲文件。

OpenDataLab 收录

PlantVillage

在这个数据集中，39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。

OpenDataLab 收录