five

timm/oxford-iiit-pet

收藏
Hugging Face2024-01-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/timm/oxford-iiit-pet
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': abyssinian '1': american_bulldog '2': american_pit_bull_terrier '3': basset_hound '4': beagle '5': bengal '6': birman '7': bombay '8': boxer '9': british_shorthair '10': chihuahua '11': egyptian_mau '12': english_cocker_spaniel '13': english_setter '14': german_shorthaired '15': great_pyrenees '16': havanese '17': japanese_chin '18': keeshond '19': leonberger '20': maine_coon '21': miniature_pinscher '22': newfoundland '23': persian '24': pomeranian '25': pug '26': ragdoll '27': russian_blue '28': saint_bernard '29': samoyed '30': scottish_terrier '31': shiba_inu '32': siamese '33': sphynx '34': staffordshire_bull_terrier '35': wheaten_terrier '36': yorkshire_terrier - name: image_id dtype: string - name: label_cat_dog dtype: class_label: names: '0': cat '1': dog splits: - name: train num_bytes: 376746044.08 num_examples: 3680 - name: test num_bytes: 426902517.206 num_examples: 3669 download_size: 790265316 dataset_size: 803648561.286 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* license: cc-by-sa-4.0 size_categories: - 1K<n<10K task_categories: - image-classification --- # The Oxford-IIIT Pet Dataset ## Description A 37 category pet dataset with roughly 200 images for each class. The images have a large variations in scale, pose and lighting. This instance of the dataset uses standard label ordering and includes the standard train/test splits. Trimaps and bbox are not included, but there is an `image_id` field that can be used to reference those annotations from official metadata. Website: https://www.robots.ox.ac.uk/~vgg/data/pets/ ## Citation ```bibtex @InProceedings{parkhi12a, author = "Omkar M. Parkhi and Andrea Vedaldi and Andrew Zisserman and C. V. Jawahar", title = "Cats and Dogs", booktitle = "IEEE Conference on Computer Vision and Pattern Recognition", year = "2012", } ```

# 牛津-IIIT宠物数据集(The Oxford-IIIT Pet Dataset) ## 数据集信息 特征项: - 特征名:图像(image),数据类型:图像 - 特征名:标签(label),数据类型为类标签(class_label),其类别名称如下: '0': 阿比西尼亚猫(abyssinian) '1': 美国斗牛犬(american_bulldog) '2': 美国比特斗牛㹴(american_pit_bull_terrier) '3': 巴塞特猎犬(basset_hound) '4': 比格犬(beagle) '5': 孟加拉猫(bengal) '6': 伯曼猫(birman) '7': 孟买猫(bombay) '8': 拳师犬(boxer) '9': 英国短毛猫(british_shorthair) '10': 吉娃娃(chihuahua) '11': 埃及猫(egyptian_mau) '12': 英国可卡犬(english_cocker_spaniel) '13': 英国塞特犬(english_setter) '14': 德国短毛指示犬(german_shorthaired) '15': 比利牛斯山犬(great_pyrenees) '16': 哈瓦那㹴(havanese) '17': 日本㹴(japanese_chin) '18': 荷兰毛狮犬(keeshond) '19': 莱昂贝格犬(leonberger) '20': 缅因库恩猫(maine_coon) '21': 迷你品犬(miniature_pinscher) '22': 纽芬兰犬(newfoundland) '23': 波斯猫(persian) '24': 博美犬(pomeranian) '25': 巴哥犬(pug) '26': 布偶猫(ragdoll) '27': 俄罗斯蓝猫(russian_blue) '28': 圣伯纳犬(saint_bernard) '29': 萨摩耶犬(samoyed) '30': 苏格兰㹴(scottish_terrier) '31': 柴犬(shiba_inu) '32': 暹罗猫(siamese) '33': 斯芬克斯猫(sphynx) '34': 斯塔福郡斗牛㹴(staffordshire_bull_terrier) '35': 软毛麦色㹴(wheaten_terrier) '36': 约克夏㹴(yorkshire_terrier) - 特征名:图像ID(image_id),数据类型:字符串(string) - 特征名:猫狗分类标签(label_cat_dog),数据类型为类标签(class_label),其类别名称如下: '0': 猫(cat) '1': 狗(dog) 数据集划分: - 划分名称:训练集(train),字节占用量:376746044.08,样本数量:3680 - 划分名称:测试集(test),字节占用量:426902517.206,样本数量:3669 下载总大小:790265316 数据集总大小:803648561.286 配置项: - 配置名称:默认配置(default),数据文件路径: - 训练集划分:data/train-* - 测试集划分:data/test-* 开源协议:CC BY-SA 4.0(知识共享署名-相同方式共享4.0协议) 样本规模分类:1K < n < 10K(样本量介于1000至10000之间) 任务类别:图像分类(image-classification) ## 数据集说明 这是一个包含37个类别的宠物数据集,每个类别约有200张图像。该数据集的图像在尺度、姿态与光照方面存在较大差异。 本数据集实例采用标准的类别标签排序方式,并包含标准的训练集/测试集划分。数据未提供三遮罩(Trimap)与边界框(bounding box,bbox),但包含`image_id`字段,可通过该字段引用官方元数据中的相关标注。 数据集官网:https://www.robots.ox.ac.uk/~vgg/data/pets/ ## 引用 bibtex @InProceedings{parkhi12a, author = "Omkar M. Parkhi and Andrea Vedaldi and Andrew Zisserman and C. V. Jawahar", title = "《猫狗》", booktitle = "IEEE计算机视觉与模式识别会议", year = "2012", }
提供机构:
timm
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • image: 图像数据
    • label: 类别标签,包括以下类别:
      • 0: abyssinian
      • 1: american_bulldog
      • 2: american_pit_bull_terrier
      • 3: basset_hound
      • 4: beagle
      • 5: bengal
      • 6: birman
      • 7: bombay
      • 8: boxer
      • 9: british_shorthair
      • 10: chihuahua
      • 11: egyptian_mau
      • 12: english_cocker_spaniel
      • 13: english_setter
      • 14: german_shorthaired
      • 15: great_pyrenees
      • 16: havanese
      • 17: japanese_chin
      • 18: keeshond
      • 19: leonberger
      • 20: maine_coon
      • 21: miniature_pinscher
      • 22: newfoundland
      • 23: persian
      • 24: pomeranian
      • 25: pug
      • 26: ragdoll
      • 27: russian_blue
      • 28: saint_bernard
      • 29: samoyed
      • 30: scottish_terrier
      • 31: shiba_inu
      • 32: siamese
      • 33: sphynx
      • 34: staffordshire_bull_terrier
      • 35: wheaten_terrier
      • 36: yorkshire_terrier
    • image_id: 图像ID,字符串类型
    • label_cat_dog: 猫狗类别标签,包括以下类别:
      • 0: cat
      • 1: dog
  • 拆分:

    • train: 训练集,包含3680个样本,大小为376746044.08字节
    • test: 测试集,包含3669个样本,大小为426902517.206字节
  • 下载大小: 790265316字节

  • 数据集大小: 803648561.286字节

  • 配置:

    • default:
      • 训练集路径: data/train-*
      • 测试集路径: data/test-*
  • 许可证: cc-by-sa-4.0

  • 大小类别: 1K<n<10K

  • 任务类别: 图像分类

描述

一个包含37个类别的宠物数据集,每个类别大约有200张图像。图像在尺度、姿态和光照方面有较大的变化。该数据集使用标准的标签顺序,并包含标准的训练/测试拆分。未包含Trimaps和bbox,但有一个image_id字段,可用于引用官方元数据中的这些注释。

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,宠物图像分类任务对数据集的多样性和标注质量提出了较高要求。牛津-IIIT宠物数据集由牛津大学视觉几何组与印度理工学院合作构建,涵盖了37个宠物类别,每个类别包含约200张图像。数据采集过程注重捕捉宠物在尺度、姿态和光照条件下的自然变化,图像来源于真实场景,确保了数据的现实代表性。该数据集遵循标准划分原则,提供了明确的训练集与测试集分割,便于模型评估与比较。
特点
该数据集在宠物识别领域展现出显著特点,其核心在于覆盖了猫和狗两大类别下的37个细分子类,包括从阿比西尼亚猫到约克夏梗等多种常见品种。图像内容呈现出丰富的视觉多样性,如宠物姿态的自由变化、拍摄角度的差异以及环境光照的自然波动,这些因素共同增强了数据集的挑战性与实用性。此外,数据集提供了双重标签体系,既包含精细的品种分类,也提供了猫与狗的高层类别标识,为多层次视觉任务研究提供了便利。
使用方法
在模型开发与应用中,该数据集主要用于图像分类任务的训练与评估。研究人员可加载标准分割后的训练集进行模型学习,利用测试集验证模型在未见样本上的泛化能力。由于数据集已预先划分,用户可直接调用相应接口读取图像与标签,无需额外处理分割问题。对于进阶研究,可通过`image_id`字段关联官方元数据,以获取更丰富的标注信息如分割掩码或边界框,从而拓展至目标检测或语义分割等视觉任务。
背景与挑战
背景概述
牛津大学视觉几何组与印度理工学院于2012年联合发布的Oxford-IIIT Pet数据集,标志着细粒度视觉分类领域的重要进展。该数据集由Omkar M. Parkhi、Andrea Vedaldi、Andrew Zisserman与C. V. Jawahar等学者共同构建,核心研究问题聚焦于宠物猫狗图像的精确物种识别。通过涵盖37个类别、每类约200张图像的数据规模,该数据集有效推动了细粒度识别、迁移学习及弱监督方法的发展,成为计算机视觉领域评估模型鲁棒性的基准资源之一。
当前挑战
该数据集旨在解决细粒度图像分类中因类间相似性高、类内差异性大而导致的识别困难。具体挑战包括宠物姿态、光照条件及背景环境的显著变化,以及部分物种在外观上的高度相似性。构建过程中,数据采集需确保类别平衡与标注一致性,同时处理图像尺度差异和复杂背景干扰,这些因素共同增加了模型训练与评估的复杂度。
常用场景
经典使用场景
在计算机视觉领域,细粒度图像分类任务常面临类别间差异细微的挑战。Oxford-IIIT Pet数据集以其涵盖37种猫狗品种、每类约200张图像的结构,成为该领域经典基准。该数据集图像在尺度、姿态和光照方面呈现显著多样性,为模型泛化能力评估提供了理想环境。研究者通常利用其标准训练-测试划分,开发并验证卷积神经网络等架构在宠物品种识别上的性能,推动细粒度视觉分类技术的演进。
衍生相关工作
围绕该数据集衍生了一系列经典研究工作,例如Parkhi等人提出的基于部件检测的细粒度分类框架,为后续方法奠定了基准。后续研究如双线性卷积神经网络(B-CNN)通过特征交互提升判别能力,注意力机制则被引入以定位关键区域。迁移学习策略也常以此数据集为验证场景,探索预训练模型在特定领域的适应性问题。这些工作共同构建了细粒度图像识别领域的方法体系,持续推动技术前沿拓展。
数据集最近研究
最新研究方向
在计算机视觉领域,宠物图像识别作为细粒度分类的经典任务,牛津-IIIT宠物数据集持续推动着前沿探索。当前研究聚焦于利用该数据集的多尺度、姿态和光照变化特性,开发鲁棒的视觉Transformer架构,以提升对37类猫狗品种的判别能力。随着自监督学习和少样本学习技术的兴起,该数据集被广泛应用于跨域适应和模型泛化性能的验证,尤其在宠物健康监测和智能养殖等热点场景中展现出重要价值。这些进展不仅深化了细粒度视觉理解的理论基础,也为现实世界的生物识别应用提供了可靠的数据支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作