Visual WetlandBirds Dataset
收藏Visual WetlandBirds 数据集概述
数据集简介
Visual WetlandBirds 数据集是一个专门用于鸟类行为检测和物种分类的细粒度时空数据集。该数据集旨在填补现有鸟类视频数据集的空白,特别是缺乏详细行为注释的视频数据集。数据集包含178个在西班牙湿地录制的视频,涵盖了13种不同的鸟类和7种不同的行为类别。
数据内容
- 视频和注释:所有视频和注释可以从 Zenodo 仓库 下载。
- 物种信息:数据集包含13种鸟类,每种鸟类的视频数量和录制时长如下表所示:
| 常见名称 | 学名 | 视频数量 | 录制时长(分钟) |
|---|---|---|---|
| 黄腿鸥 | Larus michahellis | 13 | 5.08 |
| 白鹡鸰 | Motacilla alba | 13 | 4.33 |
| 黄苇鳽 | Ardeola ralloides | 15 | 4.94 |
| 琵嘴鸭 | Spatula clypeata | 14 | 3.49 |
| 绿头鸭 | Anas platyrhynchos | 10 | 2.94 |
| 小环颈鸻 | Charadrius dubius | 10 | 1.93 |
| 彩鹮 | Plegadis falcinellus | 8 | 3.96 |
| 赤膀鸭 | Mareca strepera | 13 | 2.59 |
| 黑水鸡 | Gallinula chloropus | 18 | 9.18 |
| 喜鹊 | Pica pica | 16 | 5.95 |
| 白骨顶 | Fulica atra | 19 | 4.11 |
| 黑翅长脚鹬 | Himantopus himantopus | 14 | 3.55 |
| 红嘴鸥 | Chroicocephalus ridibundus | 15 | 6.84 |
- 注释格式:每个视频的帧级注释以CSV格式提供,每行对应一个视频帧中的一个边界框的注释,包含以下信息:
- 左上角X坐标
- 左上角Y坐标
- 右下角X坐标
- 右下角Y坐标
- 行为ID
- 主体ID(视频中鸟类的唯一标识符)
物种分类
基于YOLOv9模型的物种分类基线结果如下:
| 指标 | 结果 |
|---|---|
| 精确率 | 0.835 |
| 召回率 | 0.759 |
| mAP50 | 0.801 |
| mAP50-95 | 0.556 |
行为检测
基于不同视频分类模型的行为检测基线结果如下:
| 模型 | 学习率 | 准确率 |
|---|---|---|
| MViT | 0.005 | 0.51 |
| S3D | 0.005 | 0.29 |
| SwinTransformer | 0.009 | 0.51 |
| ResNet | 0.003 | 0.56 |
引用
如果使用该数据集,请引用以下文献:
@misc{rodriguez2025wetlandbirds, title={Visual WetlandBirds Dataset: Bird Species Identification and Behaviour Recognition in Videos}, author={Rodriguez-Juan, Javier and Ortiz-Perez, David and Benavent-Lledo, Manuel and Mulero-Pérez, David and Ruiz-Ponce, Pablo and Orihuela-Torres, Adrian and Garcia-Rodriguez, Jose and Sebastián-González, Esther}, month={dec}, year=2024, publisher={Zenodo}, doi={10.5281/zenodo.14355257}, url={https://doi.org/10.5281/zenodo.14355257} }
许可证
Visual WetlandBirds 数据集采用 MIT 许可证 发布。
致谢
感谢欧洲区域发展基金(ERDF)和MCIN/AEI/10.13039/501100011033对“CHAN-TWIN”项目的支持(资助号:TED2021-130890B-C21 和 HORIZON-MSCA-2021-SE-0,行动号:101086387,REMARKABLE)。此外,还感谢西班牙国家和地区的三个博士研究资助(FPU21/00414, FPU22/04200, FPU23/00532 CIACIF/2021/430 和 CIACIF/2022/175)。




