microsoft/cats_vs_dogs

Name: microsoft/cats_vs_dogs
Creator: microsoft
Published: 2024-08-08 05:35:11
License: 暂无描述

Hugging Face2024-08-08 更新2024-05-25 收录

下载链接：

https://hf-mirror.com/datasets/microsoft/cats_vs_dogs

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Cats Vs. Dogs，主要用于图像分类任务，特别是猫和狗的多类图像分类。数据集包含大量的猫和狗的图像，共有23410个训练样本。数据集的创建是为了测试计算机视觉算法是否能够击败Asirra CAPTCHA。数据集的图像来源于Petfinder.com，由美国各地的动物收容所的工作人员手动分类。数据集的特征包括图像和标签，标签为0表示猫，1表示狗。

提供机构：

microsoft

原始信息汇总

数据集概述：Cats Vs. Dogs

数据集描述

数据集摘要

名称: Cats Vs. Dogs
内容: 包含大量猫和狗的图像数据集。
规模: 剔除1738张损坏图像后，总图像数量为23410张。
来源: 该数据集为Asirra数据集的子集，源自Kaggle竞赛。

支持的任务和排行榜

任务: 图像分类
目标: 识别图像中是猫还是狗
排行榜: 链接

语言

语言: 英语

数据集结构

数据实例

示例:

{ image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=500x375 at 0x29CEAD71780>, labels: 0 }

数据字段

图像: PIL.Image.Image 对象
标签: int 类型，映射为 { "cat": 0, "dog": 1 }

数据分割

训练集: 23410个样本

数据集创建

来源数据

原始数据: 由Petfinder.com提供的三百万张猫狗图像
数据收集: 由数千家美国动物收容所的人员手动分类

注释

注释过程: 在Petfinder.com上选择宠物类别进行注释
注释者: Petfinder.com用户

使用数据集的考虑

讨论偏见

描述: Asirra的挑战具体、无冒犯性，不需要特殊或文化偏见的知识，有明确的真相。这使得Asirra对人类来说不那么令人沮丧。

引文信息

bibtex @Inproceedings{asirra-a-captcha-that-exploits-interest-aligned-manual-image-categorization, author = {Elson, Jeremy and Douceur, John (JD) and Howell, Jon and Saul, Jared}, title = {Asirra: A CAPTCHA that Exploits Interest-Aligned Manual Image Categorization}, booktitle = {Proceedings of 14th ACM Conference on Computer and Communications Security (CCS)}, year = {2007}, month = {October}, publisher = {Association for Computing Machinery, Inc.}, url = {https://www.microsoft.com/en-us/research/publication/asirra-a-captcha-that-exploits-interest-aligned-manual-image-categorization/}, edition = {Proceedings of 14th ACM Conference on Computer and Communications Security (CCS)}, }

搜集汇总

数据集介绍

构建方式

该数据集的构建基于对Petfinder.com网站上用户手动分类的猫狗图片的子集选取。数据集包含了从三百万张图片中精选出的约23,410张猫和狗的图片，旨在测试计算机视觉算法是否能突破Asirra CAPTCHA的挑战。图片经过标准化处理，确保了数据的一致性和可用性。

特点

此数据集的特点在于其图片来源的多样性，涵盖了不同的背景、角度、姿势和光照条件，这使得自动分类具有挑战性。此外，数据集的构建利用了众包的方式进行标注，确保了数据的真实性和准确性。数据集为单语种英文，专注于猫和狗的多类图像分类任务。

使用方法

使用该数据集时，用户可以访问其训练集，其中包含了图片及其对应的分类标签（猫或狗）。数据集通过HuggingFace的库进行管理，用户可以通过指定的数据配置文件来下载和加载训练数据，进而用于模型训练和评估。数据集的加载和图片解码可能需要一定的时间，建议先对样本索引进行查询。

背景与挑战

背景概述

Cats Vs. Dogs数据集，由微软研究院创建，旨在通过众包方式收集的图片数据，对猫和狗进行图像分类。该数据集源于Petfinder.com提供的超过三百万张猫狗图片，这些图片由全美数千个动物收容所的人员手工分类。该数据集的创建，是为了测试计算机视觉算法是否能够突破Asirra验证码的挑战，对图像识别领域的研究具有重要的推动作用。其研究成果以论文《Asirra: A CAPTCHA that Exploits Interest-Aligned Manual Image Categorization》形式发表，对后续相关领域的研究产生了深远影响。

当前挑战

在数据集构建过程中，研究者面临了多样化的挑战。首先，由于图片背景的多样性、角度、姿态、光线等因素的影响，使得自动分类的准确性难以提高。其次，数据集中存在的1738张损坏图片需要进行清理。此外，数据集的多语言性和个人敏感信息的处理也是构建过程中需要考虑的问题。在研究领域中，该数据集对于图像分类算法的准确性和泛化能力提出了挑战，要求算法能够准确地区分猫和狗的图像，同时避免过度拟合。

常用场景

经典使用场景

在计算机视觉领域，图像分类任务始终占据核心地位。microsoft/cats_vs_dogs数据集，顾名思义，提供了大量猫和狗的图片，旨在训练和测试图像分类算法。其经典的使用场景便是作为二分类任务的教学和基准测试，通过对猫和狗图片的准确分类，评估模型的性能。

解决学术问题

该数据集解决了学术研究中图像分类的基础问题，为研究者提供了一个直观的评价标准。通过在猫和狗图片上的分类准确率，可以衡量算法对于真实世界图像的识别能力，从而推动了计算机视觉技术的进步和算法的优化。

衍生相关工作

基于该数据集，学术界和工业界衍生出许多相关工作，如改进的图像分类算法、图像增强技术的应用研究以及结合深度学习的图像特征提取方法，这些都极大地丰富了图像识别领域的研究内容和技术手段。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集