timm/oxford-iiit-pet
收藏Hugging Face2024-01-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/timm/oxford-iiit-pet
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': abyssinian
'1': american_bulldog
'2': american_pit_bull_terrier
'3': basset_hound
'4': beagle
'5': bengal
'6': birman
'7': bombay
'8': boxer
'9': british_shorthair
'10': chihuahua
'11': egyptian_mau
'12': english_cocker_spaniel
'13': english_setter
'14': german_shorthaired
'15': great_pyrenees
'16': havanese
'17': japanese_chin
'18': keeshond
'19': leonberger
'20': maine_coon
'21': miniature_pinscher
'22': newfoundland
'23': persian
'24': pomeranian
'25': pug
'26': ragdoll
'27': russian_blue
'28': saint_bernard
'29': samoyed
'30': scottish_terrier
'31': shiba_inu
'32': siamese
'33': sphynx
'34': staffordshire_bull_terrier
'35': wheaten_terrier
'36': yorkshire_terrier
- name: image_id
dtype: string
- name: label_cat_dog
dtype:
class_label:
names:
'0': cat
'1': dog
splits:
- name: train
num_bytes: 376746044.08
num_examples: 3680
- name: test
num_bytes: 426902517.206
num_examples: 3669
download_size: 790265316
dataset_size: 803648561.286
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
license: cc-by-sa-4.0
size_categories:
- 1K<n<10K
task_categories:
- image-classification
---
# The Oxford-IIIT Pet Dataset
## Description
A 37 category pet dataset with roughly 200 images for each class. The images have a large variations in scale, pose and lighting.
This instance of the dataset uses standard label ordering and includes the standard train/test splits. Trimaps and bbox are not included, but there is an `image_id` field that can be used to reference those annotations from official metadata.
Website: https://www.robots.ox.ac.uk/~vgg/data/pets/
## Citation
```bibtex
@InProceedings{parkhi12a,
author = "Omkar M. Parkhi and Andrea Vedaldi and Andrew Zisserman and C. V. Jawahar",
title = "Cats and Dogs",
booktitle = "IEEE Conference on Computer Vision and Pattern Recognition",
year = "2012",
}
```
# 牛津-IIIT宠物数据集(The Oxford-IIIT Pet Dataset)
## 数据集信息
特征项:
- 特征名:图像(image),数据类型:图像
- 特征名:标签(label),数据类型为类标签(class_label),其类别名称如下:
'0': 阿比西尼亚猫(abyssinian)
'1': 美国斗牛犬(american_bulldog)
'2': 美国比特斗牛㹴(american_pit_bull_terrier)
'3': 巴塞特猎犬(basset_hound)
'4': 比格犬(beagle)
'5': 孟加拉猫(bengal)
'6': 伯曼猫(birman)
'7': 孟买猫(bombay)
'8': 拳师犬(boxer)
'9': 英国短毛猫(british_shorthair)
'10': 吉娃娃(chihuahua)
'11': 埃及猫(egyptian_mau)
'12': 英国可卡犬(english_cocker_spaniel)
'13': 英国塞特犬(english_setter)
'14': 德国短毛指示犬(german_shorthaired)
'15': 比利牛斯山犬(great_pyrenees)
'16': 哈瓦那㹴(havanese)
'17': 日本㹴(japanese_chin)
'18': 荷兰毛狮犬(keeshond)
'19': 莱昂贝格犬(leonberger)
'20': 缅因库恩猫(maine_coon)
'21': 迷你品犬(miniature_pinscher)
'22': 纽芬兰犬(newfoundland)
'23': 波斯猫(persian)
'24': 博美犬(pomeranian)
'25': 巴哥犬(pug)
'26': 布偶猫(ragdoll)
'27': 俄罗斯蓝猫(russian_blue)
'28': 圣伯纳犬(saint_bernard)
'29': 萨摩耶犬(samoyed)
'30': 苏格兰㹴(scottish_terrier)
'31': 柴犬(shiba_inu)
'32': 暹罗猫(siamese)
'33': 斯芬克斯猫(sphynx)
'34': 斯塔福郡斗牛㹴(staffordshire_bull_terrier)
'35': 软毛麦色㹴(wheaten_terrier)
'36': 约克夏㹴(yorkshire_terrier)
- 特征名:图像ID(image_id),数据类型:字符串(string)
- 特征名:猫狗分类标签(label_cat_dog),数据类型为类标签(class_label),其类别名称如下:
'0': 猫(cat)
'1': 狗(dog)
数据集划分:
- 划分名称:训练集(train),字节占用量:376746044.08,样本数量:3680
- 划分名称:测试集(test),字节占用量:426902517.206,样本数量:3669
下载总大小:790265316
数据集总大小:803648561.286
配置项:
- 配置名称:默认配置(default),数据文件路径:
- 训练集划分:data/train-*
- 测试集划分:data/test-*
开源协议:CC BY-SA 4.0(知识共享署名-相同方式共享4.0协议)
样本规模分类:1K < n < 10K(样本量介于1000至10000之间)
任务类别:图像分类(image-classification)
## 数据集说明
这是一个包含37个类别的宠物数据集,每个类别约有200张图像。该数据集的图像在尺度、姿态与光照方面存在较大差异。
本数据集实例采用标准的类别标签排序方式,并包含标准的训练集/测试集划分。数据未提供三遮罩(Trimap)与边界框(bounding box,bbox),但包含`image_id`字段,可通过该字段引用官方元数据中的相关标注。
数据集官网:https://www.robots.ox.ac.uk/~vgg/data/pets/
## 引用
bibtex
@InProceedings{parkhi12a,
author = "Omkar M. Parkhi and Andrea Vedaldi and Andrew Zisserman and C. V. Jawahar",
title = "《猫狗》",
booktitle = "IEEE计算机视觉与模式识别会议",
year = "2012",
}
提供机构:
timm
原始信息汇总
数据集概述
数据集信息
-
特征:
image: 图像数据label: 类别标签,包括以下类别:- 0: abyssinian
- 1: american_bulldog
- 2: american_pit_bull_terrier
- 3: basset_hound
- 4: beagle
- 5: bengal
- 6: birman
- 7: bombay
- 8: boxer
- 9: british_shorthair
- 10: chihuahua
- 11: egyptian_mau
- 12: english_cocker_spaniel
- 13: english_setter
- 14: german_shorthaired
- 15: great_pyrenees
- 16: havanese
- 17: japanese_chin
- 18: keeshond
- 19: leonberger
- 20: maine_coon
- 21: miniature_pinscher
- 22: newfoundland
- 23: persian
- 24: pomeranian
- 25: pug
- 26: ragdoll
- 27: russian_blue
- 28: saint_bernard
- 29: samoyed
- 30: scottish_terrier
- 31: shiba_inu
- 32: siamese
- 33: sphynx
- 34: staffordshire_bull_terrier
- 35: wheaten_terrier
- 36: yorkshire_terrier
image_id: 图像ID,字符串类型label_cat_dog: 猫狗类别标签,包括以下类别:- 0: cat
- 1: dog
-
拆分:
train: 训练集,包含3680个样本,大小为376746044.08字节test: 测试集,包含3669个样本,大小为426902517.206字节
-
下载大小: 790265316字节
-
数据集大小: 803648561.286字节
-
配置:
default:- 训练集路径:
data/train-* - 测试集路径:
data/test-*
- 训练集路径:
-
许可证: cc-by-sa-4.0
-
大小类别: 1K<n<10K
-
任务类别: 图像分类
描述
一个包含37个类别的宠物数据集,每个类别大约有200张图像。图像在尺度、姿态和光照方面有较大的变化。该数据集使用标准的标签顺序,并包含标准的训练/测试拆分。未包含Trimaps和bbox,但有一个image_id字段,可用于引用官方元数据中的这些注释。
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,宠物图像分类任务对数据集的多样性和标注质量提出了较高要求。牛津-IIIT宠物数据集由牛津大学视觉几何组与印度理工学院合作构建,涵盖了37个宠物类别,每个类别包含约200张图像。数据采集过程注重捕捉宠物在尺度、姿态和光照条件下的自然变化,图像来源于真实场景,确保了数据的现实代表性。该数据集遵循标准划分原则,提供了明确的训练集与测试集分割,便于模型评估与比较。
特点
该数据集在宠物识别领域展现出显著特点,其核心在于覆盖了猫和狗两大类别下的37个细分子类,包括从阿比西尼亚猫到约克夏梗等多种常见品种。图像内容呈现出丰富的视觉多样性,如宠物姿态的自由变化、拍摄角度的差异以及环境光照的自然波动,这些因素共同增强了数据集的挑战性与实用性。此外,数据集提供了双重标签体系,既包含精细的品种分类,也提供了猫与狗的高层类别标识,为多层次视觉任务研究提供了便利。
使用方法
在模型开发与应用中,该数据集主要用于图像分类任务的训练与评估。研究人员可加载标准分割后的训练集进行模型学习,利用测试集验证模型在未见样本上的泛化能力。由于数据集已预先划分,用户可直接调用相应接口读取图像与标签,无需额外处理分割问题。对于进阶研究,可通过`image_id`字段关联官方元数据,以获取更丰富的标注信息如分割掩码或边界框,从而拓展至目标检测或语义分割等视觉任务。
背景与挑战
背景概述
牛津大学视觉几何组与印度理工学院于2012年联合发布的Oxford-IIIT Pet数据集,标志着细粒度视觉分类领域的重要进展。该数据集由Omkar M. Parkhi、Andrea Vedaldi、Andrew Zisserman与C. V. Jawahar等学者共同构建,核心研究问题聚焦于宠物猫狗图像的精确物种识别。通过涵盖37个类别、每类约200张图像的数据规模,该数据集有效推动了细粒度识别、迁移学习及弱监督方法的发展,成为计算机视觉领域评估模型鲁棒性的基准资源之一。
当前挑战
该数据集旨在解决细粒度图像分类中因类间相似性高、类内差异性大而导致的识别困难。具体挑战包括宠物姿态、光照条件及背景环境的显著变化,以及部分物种在外观上的高度相似性。构建过程中,数据采集需确保类别平衡与标注一致性,同时处理图像尺度差异和复杂背景干扰,这些因素共同增加了模型训练与评估的复杂度。
常用场景
经典使用场景
在计算机视觉领域,细粒度图像分类任务常面临类别间差异细微的挑战。Oxford-IIIT Pet数据集以其涵盖37种猫狗品种、每类约200张图像的结构,成为该领域经典基准。该数据集图像在尺度、姿态和光照方面呈现显著多样性,为模型泛化能力评估提供了理想环境。研究者通常利用其标准训练-测试划分,开发并验证卷积神经网络等架构在宠物品种识别上的性能,推动细粒度视觉分类技术的演进。
衍生相关工作
围绕该数据集衍生了一系列经典研究工作,例如Parkhi等人提出的基于部件检测的细粒度分类框架,为后续方法奠定了基准。后续研究如双线性卷积神经网络(B-CNN)通过特征交互提升判别能力,注意力机制则被引入以定位关键区域。迁移学习策略也常以此数据集为验证场景,探索预训练模型在特定领域的适应性问题。这些工作共同构建了细粒度图像识别领域的方法体系,持续推动技术前沿拓展。
数据集最近研究
最新研究方向
在计算机视觉领域,宠物图像识别作为细粒度分类的经典任务,牛津-IIIT宠物数据集持续推动着前沿探索。当前研究聚焦于利用该数据集的多尺度、姿态和光照变化特性,开发鲁棒的视觉Transformer架构,以提升对37类猫狗品种的判别能力。随着自监督学习和少样本学习技术的兴起,该数据集被广泛应用于跨域适应和模型泛化性能的验证,尤其在宠物健康监测和智能养殖等热点场景中展现出重要价值。这些进展不仅深化了细粒度视觉理解的理论基础,也为现实世界的生物识别应用提供了可靠的数据支撑。
以上内容由遇见数据集搜集并总结生成



