microsoft/cats_vs_dogs
收藏数据集概述:Cats Vs. Dogs
数据集描述
数据集摘要
- 名称: Cats Vs. Dogs
- 内容: 包含大量猫和狗的图像数据集。
- 规模: 剔除1738张损坏图像后,总图像数量为23410张。
- 来源: 该数据集为Asirra数据集的子集,源自Kaggle竞赛。
支持的任务和排行榜
- 任务: 图像分类
- 目标: 识别图像中是猫还是狗
- 排行榜: 链接
语言
- 语言: 英语
数据集结构
数据实例
-
示例:
{ image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=500x375 at 0x29CEAD71780>, labels: 0 }
数据字段
- 图像:
PIL.Image.Image对象 - 标签:
int类型,映射为{ "cat": 0, "dog": 1 }
数据分割
- 训练集: 23410个样本
数据集创建
来源数据
- 原始数据: 由Petfinder.com提供的三百万张猫狗图像
- 数据收集: 由数千家美国动物收容所的人员手动分类
注释
- 注释过程: 在Petfinder.com上选择宠物类别进行注释
- 注释者: Petfinder.com用户
使用数据集的考虑
讨论偏见
- 描述: Asirra的挑战具体、无冒犯性,不需要特殊或文化偏见的知识,有明确的真相。这使得Asirra对人类来说不那么令人沮丧。
引文信息
bibtex @Inproceedings{asirra-a-captcha-that-exploits-interest-aligned-manual-image-categorization, author = {Elson, Jeremy and Douceur, John (JD) and Howell, Jon and Saul, Jared}, title = {Asirra: A CAPTCHA that Exploits Interest-Aligned Manual Image Categorization}, booktitle = {Proceedings of 14th ACM Conference on Computer and Communications Security (CCS)}, year = {2007}, month = {October}, publisher = {Association for Computing Machinery, Inc.}, url = {https://www.microsoft.com/en-us/research/publication/asirra-a-captcha-that-exploits-interest-aligned-manual-image-categorization/}, edition = {Proceedings of 14th ACM Conference on Computer and Communications Security (CCS)}, }




