HPatches|计算机视觉数据集|图像处理数据集
收藏数据集概述
数据集名称
HPatches: Homography-patches dataset
数据集用途
用于评估局部描述符的性能,特别是在光照变化和视角变化下的表现。
数据集结构
- 序列类型:
i_X
:光照变化序列v_X
:视角变化序列
- 文件格式:
ref.png
:参考图像的参考补丁eX.png
和hX.png
:其他图像中的对应补丁,其中e
表示简单,h
表示困难- 每个补丁大小为
65x65
像素,存储在单个.png
文件中,补丁沿单列堆叠
补丁提取方法
- 参考图像与目标图像:
- 每个序列包含一个参考图像和5个目标图像,这些图像在光照和/或视角上有所不同
- 提供每个图像相对于参考图像的地面实况单应性 $H$
- 补丁提取:
- 使用局部特征提取器(Hessian、Harris和DoG检测器)在参考图像中采样补丁
- 补丁方向通过Lowe的方法估计,不使用仿射适应,所有补丁为方形区域
- 补丁从检测到的特征尺度放大5倍的区域提取,确保完全包含在图像中
- 防止多重检测,超过50%椭圆重叠的多个检测被聚类,随机保留一个
数据集下载
- 补丁数据集:
- HPatches [4.2GB]
- 完整图像序列:
- HPatches full sequences [1.3GB]
引用信息
- 参考文献:
- HPatches: A benchmark and evaluation of handcrafted and learned local descriptors, Vassileios Balntas*, Karel Lenc*, Andrea Vedaldi and Krystian Mikolajczyk, CVPR 2017.

中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录