sasha/birdsnap
收藏Hugging Face2022-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sasha/birdsnap
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype: string
splits:
- name: train
num_bytes: 63184668691.7
num_examples: 39860
download_size: 69093722465
dataset_size: 63184668691.7
---
# Dataset Card for Birdsnap Dataset v 1.1.
Welcome to the Birdsnap dataset, consisting of 49,829 images of 500 species of North American birds, collected from Flickr, and corresponding species, bounding box, and part labels.
The dataset distribution also consists of the following files:
1. species.txt
This file lists the species in the dataset. The first line is a header. Each subsequent line represents a species. Lines are tab-delimited, and the fields
are:
- id: An integer id for the species. These ids run from 1 to 500 for the 500 species.
- common: The common English name of the species, for example "Blue Jay."
- scientific: The scientific (Latin) name of the species, for example "Cyanocitta cristata."
- dir: The name of the a directory in which to store the images of this species. This is just the common name with spaces and other dangerous-in-file-path characters replaced or removed.
2. images.txt
This file lists the images in the dataset, with the coresponding bounding boxes, part locations, and species labels. Like species.txt, it is tab-delimited with the first line giving field names. The fields are:
- url: The URL from which the image was downloaded.
- md5: An MD5 sum of the image file constants.
- path: The local path of the image.
- species_id: The id of the species of the labeled bird in the image.
- bb_x1, bb_y1, bb_x2, bb_y2: The coordinates of the top-left (bb_x1, bb_y1) and bottom-right (bb_x2, bb_y2) corners of the bounding box of the labeled
bird.
- ${part}_x, ${part}_y: The coordinates of part ${part}. Parts are back, beak, belly, breast, crown, forehead, left_cheek, left_eye, left_leg, left_wing, nape, right_cheek, right_eye, right_leg, right_wing, tail, throat.
3. test_images.txt
This file lists the 2443 test images used in the species identification experiments in the paper. It has a header line, then the "path" (from images.txt) of each test image, one per line.
### Citation
```
@inproceedings{berg2014birdsnap,
title={Birdsnap: Large-scale fine-grained visual categorization of birds},
author={Berg, Thomas and Liu, Jiongxin and Woo Lee, Seung and Alexander, Michelle L and Jacobs, David W and Belhumeur, Peter N},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={2011--2018},
year={2014}
}
```
数据集信息:
特征:
- 名称:image(图像),数据类型:image(图像)
- 名称:label(标签),数据类型:string(字符串)
数据集划分:
- 名称:train(训练集),字节占用:63184668691.7,样本数量:39860
下载总大小:69093722465,数据集存储总大小:63184668691.7
# Birdsnap数据集v1.1版本数据集卡片
欢迎使用Birdsnap数据集,该数据集涵盖北美地区500个鸟类物种,包含从Flickr平台采集的49829张图像,并附带对应的物种标注、边界框(bounding box)与身体部位标注。
本数据集附带以下文件:
1. species.txt(物种列表文件)
该文件收录了数据集中的全部鸟类物种。文件首行为表头,后续每一行对应一个物种。各行以制表符分隔,各字段含义如下:
- id:物种的整数编号,本次数据集包含500个物种,编号范围为1至500。
- common:该物种的通用英文名,例如"Blue Jay"。
- scientific:该物种的科学学名(拉丁名),例如"Cyanocitta cristata"。
- dir:存储该物种图像的目录名称,该名称由通用英文名转换而来,已将空格与文件路径中非法的字符替换或移除。
2. images.txt(图像列表文件)
该文件列出了数据集中的所有图像,并附带对应的边界框、身体部位坐标与物种标注。与species.txt类似,该文件首行为字段名,各行以制表符分隔,各字段含义如下:
- url:下载该图像的原始URL。
- md5:图像文件的MD5哈希值。
- path:该图像在本地的存储路径。
- species_id:图像中标注鸟类所属物种的编号。
- bb_x1, bb_y1, bb_x2, bb_y2:标注鸟类的边界框(bounding box)坐标,其中(bb_x1, bb_y1)为左上角顶点,(bb_x2, bb_y2)为右下角顶点。
- ${part}_x, ${part}_y:身体部位${part}的坐标。可识别的身体部位包括:背部(back)、喙(beak)、腹部(belly)、胸部(breast)、头顶(crown)、前额(forehead)、左脸颊(left_cheek)、左眼(left_eye)、左腿(left_leg)、左翼(left_wing)、颈背(nape)、右脸颊(right_cheek)、右眼(right_eye)、右腿(right_leg)、右翼(right_wing)、尾部(tail)、喉部(throat)。
3. test_images.txt(测试图像列表文件)
该文件列出了论文中物种识别实验所用的2443张测试图像。文件首行为表头,后续每一行对应一张测试图像的`path`字段(即images.txt中的本地路径)。
### 引用文献
@inproceedings{berg2014birdsnap,
title={Birdsnap:面向鸟类的大规模细粒度视觉分类任务},
author={Berg, Thomas and Liu, Jiongxin and Woo Lee, Seung and Alexander, Michelle L and Jacobs, David W and Belhumeur, Peter N},
booktitle={IEEE计算机视觉与模式识别会议论文集},
pages={2011--2018},
year={2014}
}
提供机构:
sasha
原始信息汇总
数据集概述
数据集名称
Birdsnap Dataset v 1.1
数据集内容
- 图像数量: 49,829张
- 物种数量: 500种北美鸟类
- 数据来源: 图像收集自Flickr
- 标签信息: 包含物种标签、边界框和部位标签
数据集文件
-
species.txt
- 包含物种信息,格式为tab-delimited,字段包括:
- id: 物种的整数ID,范围1至500。
- common: 物种的英文通用名称。
- scientific: 物种的科学名称。
- dir: 存储该物种图像的目录名称。
- 包含物种信息,格式为tab-delimited,字段包括:
-
images.txt
- 包含图像及其相关信息,格式为tab-delimited,字段包括:
- url: 图像下载的URL。
- md5: 图像文件的MD5校验和。
- path: 图像的本地路径。
- species_id: 图像中标示的鸟类物种ID。
- bb_x1, bb_y1, bb_x2, bb_y2: 边界框的坐标。
- ${part}_x, ${part}_y: 各部位的坐标。
- 包含图像及其相关信息,格式为tab-delimited,字段包括:
-
test_images.txt
- 包含2443张用于物种识别实验的测试图像路径。
数据集特征
- 特征名称: image, label
- 特征类型: image, string
数据集分割
- 训练集
- 样本数量: 39,860
- 数据大小: 63,184,668,691.7字节
数据集大小
- 下载大小: 69,093,722,465字节
- 数据集总大小: 63,184,668,691.7字节
搜集汇总
数据集介绍

背景与挑战
背景概述
Birdsnap数据集包含49,829张北美500种鸟类的图像,每张图像都有物种标签、边界框和部位标签。数据集来自Flickr,并提供了详细的物种信息和图像元数据。
以上内容由遇见数据集搜集并总结生成



