timm/oxford-iiit-pet

Name: timm/oxford-iiit-pet
Creator: timm
Published: 2024-01-07 18:10:47
License: 暂无描述

Hugging Face2024-01-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/timm/oxford-iiit-pet

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': abyssinian '1': american_bulldog '2': american_pit_bull_terrier '3': basset_hound '4': beagle '5': bengal '6': birman '7': bombay '8': boxer '9': british_shorthair '10': chihuahua '11': egyptian_mau '12': english_cocker_spaniel '13': english_setter '14': german_shorthaired '15': great_pyrenees '16': havanese '17': japanese_chin '18': keeshond '19': leonberger '20': maine_coon '21': miniature_pinscher '22': newfoundland '23': persian '24': pomeranian '25': pug '26': ragdoll '27': russian_blue '28': saint_bernard '29': samoyed '30': scottish_terrier '31': shiba_inu '32': siamese '33': sphynx '34': staffordshire_bull_terrier '35': wheaten_terrier '36': yorkshire_terrier - name: image_id dtype: string - name: label_cat_dog dtype: class_label: names: '0': cat '1': dog splits: - name: train num_bytes: 376746044.08 num_examples: 3680 - name: test num_bytes: 426902517.206 num_examples: 3669 download_size: 790265316 dataset_size: 803648561.286 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* license: cc-by-sa-4.0 size_categories: - 1K<n<10K task_categories: - image-classification --- # The Oxford-IIIT Pet Dataset ## Description A 37 category pet dataset with roughly 200 images for each class. The images have a large variations in scale, pose and lighting. This instance of the dataset uses standard label ordering and includes the standard train/test splits. Trimaps and bbox are not included, but there is an `image_id` field that can be used to reference those annotations from official metadata. Website: https://www.robots.ox.ac.uk/~vgg/data/pets/ ## Citation ```bibtex @InProceedings{parkhi12a, author = "Omkar M. Parkhi and Andrea Vedaldi and Andrew Zisserman and C. V. Jawahar", title = "Cats and Dogs", booktitle = "IEEE Conference on Computer Vision and Pattern Recognition", year = "2012", } ```

# 牛津-IIIT宠物数据集（The Oxford-IIIT Pet Dataset） ## 数据集信息特征项： - 特征名：图像（image），数据类型：图像 - 特征名：标签（label），数据类型为类标签（class_label），其类别名称如下： '0': 阿比西尼亚猫（abyssinian） '1': 美国斗牛犬（american_bulldog） '2': 美国比特斗牛㹴（american_pit_bull_terrier） '3': 巴塞特猎犬（basset_hound） '4': 比格犬（beagle） '5': 孟加拉猫（bengal） '6': 伯曼猫（birman） '7': 孟买猫（bombay） '8': 拳师犬（boxer） '9': 英国短毛猫（british_shorthair） '10': 吉娃娃（chihuahua） '11': 埃及猫（egyptian_mau） '12': 英国可卡犬（english_cocker_spaniel） '13': 英国塞特犬（english_setter） '14': 德国短毛指示犬（german_shorthaired） '15': 比利牛斯山犬（great_pyrenees） '16': 哈瓦那㹴（havanese） '17': 日本㹴（japanese_chin） '18': 荷兰毛狮犬（keeshond） '19': 莱昂贝格犬（leonberger） '20': 缅因库恩猫（maine_coon） '21': 迷你品犬（miniature_pinscher） '22': 纽芬兰犬（newfoundland） '23': 波斯猫（persian） '24': 博美犬（pomeranian） '25': 巴哥犬（pug） '26': 布偶猫（ragdoll） '27': 俄罗斯蓝猫（russian_blue） '28': 圣伯纳犬（saint_bernard） '29': 萨摩耶犬（samoyed） '30': 苏格兰㹴（scottish_terrier） '31': 柴犬（shiba_inu） '32': 暹罗猫（siamese） '33': 斯芬克斯猫（sphynx） '34': 斯塔福郡斗牛㹴（staffordshire_bull_terrier） '35': 软毛麦色㹴（wheaten_terrier） '36': 约克夏㹴（yorkshire_terrier） - 特征名：图像ID（image_id），数据类型：字符串（string） - 特征名：猫狗分类标签（label_cat_dog），数据类型为类标签（class_label），其类别名称如下： '0': 猫（cat） '1': 狗（dog）数据集划分： - 划分名称：训练集（train），字节占用量：376746044.08，样本数量：3680 - 划分名称：测试集（test），字节占用量：426902517.206，样本数量：3669 下载总大小：790265316 数据集总大小：803648561.286 配置项： - 配置名称：默认配置（default），数据文件路径： - 训练集划分：data/train-* - 测试集划分：data/test-* 开源协议：CC BY-SA 4.0（知识共享署名-相同方式共享4.0协议）样本规模分类：1K < n < 10K（样本量介于1000至10000之间）任务类别：图像分类（image-classification） ## 数据集说明这是一个包含37个类别的宠物数据集，每个类别约有200张图像。该数据集的图像在尺度、姿态与光照方面存在较大差异。本数据集实例采用标准的类别标签排序方式，并包含标准的训练集/测试集划分。数据未提供三遮罩（Trimap）与边界框（bounding box，bbox），但包含`image_id`字段，可通过该字段引用官方元数据中的相关标注。数据集官网：https://www.robots.ox.ac.uk/~vgg/data/pets/ ## 引用 bibtex @InProceedings{parkhi12a, author = "Omkar M. Parkhi and Andrea Vedaldi and Andrew Zisserman and C. V. Jawahar", title = "《猫狗》", booktitle = "IEEE计算机视觉与模式识别会议", year = "2012", }

提供机构：

timm

原始信息汇总

数据集概述

数据集信息

特征:
- image: 图像数据
- label: 类别标签，包括以下类别：
  - 0: abyssinian
  - 1: american_bulldog
  - 2: american_pit_bull_terrier
  - 3: basset_hound
  - 4: beagle
  - 5: bengal
  - 6: birman
  - 7: bombay
  - 8: boxer
  - 9: british_shorthair
  - 10: chihuahua
  - 11: egyptian_mau
  - 12: english_cocker_spaniel
  - 13: english_setter
  - 14: german_shorthaired
  - 15: great_pyrenees
  - 16: havanese
  - 17: japanese_chin
  - 18: keeshond
  - 19: leonberger
  - 20: maine_coon
  - 21: miniature_pinscher
  - 22: newfoundland
  - 23: persian
  - 24: pomeranian
  - 25: pug
  - 26: ragdoll
  - 27: russian_blue
  - 28: saint_bernard
  - 29: samoyed
  - 30: scottish_terrier
  - 31: shiba_inu
  - 32: siamese
  - 33: sphynx
  - 34: staffordshire_bull_terrier
  - 35: wheaten_terrier
  - 36: yorkshire_terrier
- image_id: 图像ID，字符串类型
- label_cat_dog: 猫狗类别标签，包括以下类别：
  - 0: cat
  - 1: dog
拆分:
- train: 训练集，包含3680个样本，大小为376746044.08字节
- test: 测试集，包含3669个样本，大小为426902517.206字节
下载大小: 790265316字节
数据集大小: 803648561.286字节
配置:
- default:
  - 训练集路径: data/train-*
  - 测试集路径: data/test-*
许可证: cc-by-sa-4.0
大小类别: 1K<n<10K
任务类别: 图像分类

描述

一个包含37个类别的宠物数据集，每个类别大约有200张图像。图像在尺度、姿态和光照方面有较大的变化。该数据集使用标准的标签顺序，并包含标准的训练/测试拆分。未包含Trimaps和bbox，但有一个image_id字段，可用于引用官方元数据中的这些注释。

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，宠物图像分类任务对数据集的多样性和标注质量提出了较高要求。牛津-IIIT宠物数据集由牛津大学视觉几何组与印度理工学院合作构建，涵盖了37个宠物类别，每个类别包含约200张图像。数据采集过程注重捕捉宠物在尺度、姿态和光照条件下的自然变化，图像来源于真实场景，确保了数据的现实代表性。该数据集遵循标准划分原则，提供了明确的训练集与测试集分割，便于模型评估与比较。

特点

该数据集在宠物识别领域展现出显著特点，其核心在于覆盖了猫和狗两大类别下的37个细分子类，包括从阿比西尼亚猫到约克夏梗等多种常见品种。图像内容呈现出丰富的视觉多样性，如宠物姿态的自由变化、拍摄角度的差异以及环境光照的自然波动，这些因素共同增强了数据集的挑战性与实用性。此外，数据集提供了双重标签体系，既包含精细的品种分类，也提供了猫与狗的高层类别标识，为多层次视觉任务研究提供了便利。

使用方法

在模型开发与应用中，该数据集主要用于图像分类任务的训练与评估。研究人员可加载标准分割后的训练集进行模型学习，利用测试集验证模型在未见样本上的泛化能力。由于数据集已预先划分，用户可直接调用相应接口读取图像与标签，无需额外处理分割问题。对于进阶研究，可通过`image_id`字段关联官方元数据，以获取更丰富的标注信息如分割掩码或边界框，从而拓展至目标检测或语义分割等视觉任务。

背景与挑战

背景概述

牛津大学视觉几何组与印度理工学院于2012年联合发布的Oxford-IIIT Pet数据集，标志着细粒度视觉分类领域的重要进展。该数据集由Omkar M. Parkhi、Andrea Vedaldi、Andrew Zisserman与C. V. Jawahar等学者共同构建，核心研究问题聚焦于宠物猫狗图像的精确物种识别。通过涵盖37个类别、每类约200张图像的数据规模，该数据集有效推动了细粒度识别、迁移学习及弱监督方法的发展，成为计算机视觉领域评估模型鲁棒性的基准资源之一。

当前挑战

该数据集旨在解决细粒度图像分类中因类间相似性高、类内差异性大而导致的识别困难。具体挑战包括宠物姿态、光照条件及背景环境的显著变化，以及部分物种在外观上的高度相似性。构建过程中，数据采集需确保类别平衡与标注一致性，同时处理图像尺度差异和复杂背景干扰，这些因素共同增加了模型训练与评估的复杂度。

常用场景

经典使用场景

在计算机视觉领域，细粒度图像分类任务常面临类别间差异细微的挑战。Oxford-IIIT Pet数据集以其涵盖37种猫狗品种、每类约200张图像的结构，成为该领域经典基准。该数据集图像在尺度、姿态和光照方面呈现显著多样性，为模型泛化能力评估提供了理想环境。研究者通常利用其标准训练-测试划分，开发并验证卷积神经网络等架构在宠物品种识别上的性能，推动细粒度视觉分类技术的演进。

衍生相关工作

围绕该数据集衍生了一系列经典研究工作，例如Parkhi等人提出的基于部件检测的细粒度分类框架，为后续方法奠定了基准。后续研究如双线性卷积神经网络（B-CNN）通过特征交互提升判别能力，注意力机制则被引入以定位关键区域。迁移学习策略也常以此数据集为验证场景，探索预训练模型在特定领域的适应性问题。这些工作共同构建了细粒度图像识别领域的方法体系，持续推动技术前沿拓展。

数据集最近研究