five

society-ethics/lila_camera_traps

收藏
Hugging Face2025-07-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/society-ethics/lila_camera_traps
下载链接
链接失效反馈
官方服务:
资源简介:
LILA Camera Traps数据集是一个由多个相机陷阱数据集聚合而成的图像分类数据集,主要用于生态研究和野生动物监测。该数据集首次将不同的相机陷阱数据集整合到一个统一的训练环境中,并使用单一的分类体系。数据集包含多个子数据集,每个子数据集都有详细的描述、标签、注释、许可证信息以及相关的引用文献。数据集的主要任务是图像分类,标签包括动物种类、空图像等。数据集的语言为英语,且为单语言数据集。

The LILA Camera Traps dataset is an image classification dataset aggregated from multiple camera trap datasets, primarily used for ecological research and wildlife monitoring. This dataset is the first to integrate disparate camera trap datasets into a unified training environment with a single classification taxonomy. The dataset comprises multiple sub-datasets, each featuring detailed descriptions, labels, annotations, license information, and relevant references. The core task of this dataset is image classification, with labels covering animal species, empty images, and more. The dataset is in English and is a monolingual dataset.
提供机构:
society-ethics
原始信息汇总

数据集卡片 for LILA Camera Traps

数据集描述

数据集概述

LILA Camera Traps 是一个由相机陷阱拍摄的图像集合,这些设备通过运动检测自动捕捉野生动物的图像,以帮助生态研究。这是首次将不同的相机陷阱数据集整合到一个统一的训练环境中,并使用单一的分类法。

该数据集仅包含相机陷阱图像数据集,而更广泛的 LILA 网站还包含与生物学和保护相关的其他数据集,旨在为机器学习(ML)研究人员和希望利用ML进行此主题的人提供资源。

支持的任务和排行榜

  • 任务类别: 图像分类

语言

  • 语言: 英语

数据集结构

数据实例

数据集包含多个子数据集,每个子数据集的详细信息如下:

<details> <summary> Caltech Camera Traps </summary>

  • 图像数量: 243,100
  • 相机位置: 140个
  • 标签: 21个动物类别(加上空)
  • 主要标签级别: 物种级别
  • 边界框注释: 约66,000个
  • 空图像比例: 约70%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: caltechcameratraps@gmail.com
  • 引用: bibtex @inproceedings{DBLP:conf/eccv/BeeryHP18, author = {Sara Beery and Grant Van Horn and Pietro Perona}, title = {Recognition in Terra Incognita}, booktitle = {Computer Vision - {ECCV} 2018 - 15th European Conference, Munich, Germany, September 8-14, 2018, Proceedings, Part {XVI}}, pages = {472--489}, year = {2018}, crossref = {DBLP:conf/eccv/2018-16}, url = {https://doi.org/10.1007/978-3-030-01270-0_28}, doi = {10.1007/978-3-030-01270-0_28}, timestamp = {Mon, 08 Oct 2018 17:08:07 +0200}, biburl = {https://dblp.org/rec/bib/conf/eccv/BeeryHP18}, bibsource = {dblp computer science bibliography, https://dblp.org} }

</details>

<details> <summary> ENA24 </summary>

  • 图像数量: 约10,000
  • 标签: 23个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 每个图像都有
  • 空图像比例: 未明确
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: Hayder Yousif (hyypp5@mail.missouri.edu)
  • 引用: bibtex @article{yousif2019dynamic, title={Dynamic Programming Selection of Object Proposals for Sequence-Level Animal Species Classification in the Wild}, author={Yousif, Hayder and Kays, Roland and He, Zhihai}, journal={IEEE Transactions on Circuits and Systems for Video Technology}, year={2019}, publisher={IEEE} }

</details>

<details> <summary> Missouri Camera Traps </summary>

  • 图像数量: 约25,000
  • 标签: 20个物种
  • 主要标签级别: 物种级别
  • 边界框注释: 约900个
  • 空图像比例: 未明确
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: Hayder Yousif (hyypp5@mail.missouri.edu) 和 Zhi Zhang (zzbhf@mail.missouri.edu)
  • 引用: bibtex @article{zhang2016animal, title={Animal detection from highly cluttered natural scenes using spatiotemporal object region proposals and patch verification}, author={Zhang, Zhi and He, Zhihai and Cao, Guitao and Cao, Wenming}, journal={IEEE Transactions on Multimedia}, volume={18}, number={10}, pages={2079--2092}, year={2016}, publisher={IEEE} }

</details>

<details> <summary> North American Camera Trap Images (NACTI) </summary>

  • 图像数量: 3.7M
  • 标签: 28个动物类别
  • 主要标签级别: 物种级别
  • 边界框注释: 8892个图像
  • 空图像比例: 约12%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: northamericancameratrapimages@gmail.com
  • 引用: bibtex @article{tabak2019machine, title={Machine learning to classify animal species in camera trap images: Applications in ecology}, author={Tabak, Michael A and Norouzzadeh, Mohammad S and Wolfson, David W and Sweeney, Steven J and VerCauteren, Kurt C and Snow, Nathan P and Halseth, Joseph M and Di Salvo, Paul A and Lewis, Jesse S and White, Michael D and others}, journal={Methods in Ecology and Evolution}, volume={10}, number={4}, pages={585--590}, year={2019}, publisher={Wiley Online Library} }

</details>

<details> <summary> WCS Camera Traps </summary>

  • 图像数量: 约1.4M
  • 标签: 约675个物种
  • 主要标签级别: 物种级别
  • 边界框注释: 约375,000个
  • 空图像比例: 约50%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: 未明确
  • 引用: 未明确 </details>

<details> <summary> Wellington Camera Traps </summary>

  • 图像数量: 270,450
  • 标签: 17个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 未明确
  • 空图像比例: 约17%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: Victor Anton (vykanton@gmail.com)
  • 引用: bibtex @article{anton2018monitoring, title={Monitoring the mammalian fauna of urban areas using remote cameras and citizen science}, author={Anton, Victor and Hartley, Stephen and Geldenhuis, Andre and Wittmer, Heiko U}, journal={Journal of Urban Ecology}, volume={4}, number={1}, pages={juy002}, year={2018}, publisher={Oxford University Press} }

</details>

<details> <summary> Island Conservation Camera Traps </summary>

  • 图像数量: 约123,000
  • 标签: 多个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 约65,000个
  • 空图像比例: 约60%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: David Will (david.will@islandconservation.org)
  • 引用: 未明确 </details>

<details> <summary> Channel Islands Camera Traps </summary>

  • 图像数量: 246,529
  • 标签: 多个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 所有动物都有
  • 空图像比例: 约47%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: Nathaniel Rindlaub (nathaniel.rindlaub@TNC.ORG)
  • 引用: bibtex The Nature Conservancy (2021): Channel Islands Camera Traps 1.0. The Nature Conservancy. Dataset.

</details>

<details> <summary> Idaho Camera Traps </summary>

  • 图像数量: 约1.5M
  • 标签: 62个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 未明确
  • 空图像比例: 约70.5%
  • 许可证: 未明确
  • 联系人: 未明确
  • 引用: 未明确 </details>

<details> <summary> Snapshot Serengeti </summary>

  • 图像数量: 约7.1M
  • 标签: 61个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 约150,000个
  • 空图像比例: 约76%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: Sarah Huebner (huebn090@umn.edu)
  • 引用: bibtex @misc{dryad_5pt92, title = {Data from: Snapshot Serengeti, high-frequency annotated camera trap images of 40 mammalian species in an African savanna}, author = {Swanson, AB and Kosmala, M and Lintott, CJ and Simpson, RJ and Smith, A and Packer, C}, year = {2015}, journal = {Scientific Data}, URL = {https://doi.org/10.5061/dryad.5pt92}, doi = {doi:10.5061/dryad.5pt92}, publisher = {Dryad Digital Repository} }

</details>

<details> <summary> Snapshot Karoo </summary>

  • 图像数量: 38074
  • 标签: 38个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 未明确
  • 空图像比例: 约83.02%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: Sarah Huebner (huebn090@umn.edu)
  • 引用: 未明确 </details>

<details> <summary> Snapshot Kgalagadi </summary>

  • 图像数量: 10222
  • 标签: 31个类别
  • 主要标签级别: 物种级别
  • 边界框注释: 未明确
  • 空图像比例: 约76.14%
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: Sarah Huebner (huebn090@umn.edu)
  • 引用: 未明确 </details>

<details> <summary> Snapshot Enonkishu </summary>

  • 图像数量: 28544
  • 标签: 未明确
  • 主要标签级别: 未明确
  • 边界框注释: 未明确
  • 空图像比例: 未明确
  • 许可证: Community Data License Agreement (permissive variant)
  • 联系人: 未明确
  • 引用: 未明确 </details>

数据字段

  • 图像: 相机陷阱拍摄的图像
  • 标签: 动物类别、空、未分类等
  • 边界框注释: 部分图像包含边界框注释

数据分割

  • 训练集: 未明确
  • 验证集: 未明确
  • 测试集: 未明确

数据集创建

策划理由

  • 目的: 将不同的相机陷阱数据集整合到一个统一的训练环境中,以帮助生态研究和机器学习应用。

源数据

  • 原始数据: 来自多个相机陷阱项目

注释

  • 注释者: 专家生成

个人和敏感信息

  • 处理: 图像中包含人类的图像已被移除

使用数据的注意事项

数据集的社会影响

  • 影响: 有助于生态研究和野生动物监测

偏见的讨论

  • 偏见: 未明确

其他已知限制

  • 限制: 未明确

附加信息

教程

  • 教程: 未明确

与分类法合作

  • 分类法: 单一分类法

数据集策展人

  • 策展人: 未明确

许可信息

  • 许可: Community Data License Agreement (permissive variant)

引用信息

  • 引用: 每个子数据集的引用信息在相应部分提供

贡献

  • 贡献: 未明确
搜集汇总
数据集介绍
main_image_url
构建方式
在生态学与计算机视觉交叉领域,LILA Camera Traps数据集通过整合全球多个独立相机陷阱项目构建而成。该数据集汇集了包括Caltech Camera Traps、Snapshot Serengeti等十余个子集,覆盖从北美、非洲到岛屿生态系统的广泛地理区域。构建过程中,研究团队采用统一的分类学映射框架,将各来源的物种标签进行标准化对齐,并保留了原始的图像序列结构与边界框标注。数据整合不仅涉及图像与标注的合并,还通过专家审核确保分类一致性,从而形成了首个大规模、多源统一的相机陷阱图像训练环境。
特点
该数据集的核心特点在于其空前的规模与生态多样性,总图像量介于千万至亿级,涵盖数百个物种类别。图像内容呈现高度复杂的自然场景,包含大量动态模糊、遮挡及光照变化,真实反映了野外监测的挑战性。数据标注兼具图像级与序列级标签,并附有精细的边界框注释,支持细粒度物种识别与目标检测任务。此外,数据集特别注重隐私保护,已移除含有人类形象的图像,同时通过元数据保留相关标记,为合规使用提供便利。
使用方法
该数据集适用于训练与评估野生动物监测领域的机器学习模型,尤其在图像分类与目标检测任务中具有重要价值。使用者可通过HuggingFace平台或LILA官网访问数据,各子集均以标准图像格式存储,并配有结构化标注文件。在实际应用中,建议依据研究目标选择特定地理或生态子集进行训练,以应对不同物种分布与场景特性。数据加载后,可利用预划分的图像序列或自行定义训练验证分割,结合边界框信息开发鲁棒的检测算法。使用中需遵循对应的社区数据许可协议,并在发表成果时引用相关子集的原始文献。
背景与挑战
背景概述
LILA Camera Traps数据集由LILA科学平台于近年构建,旨在整合全球范围内分散的相机陷阱图像数据,为生物多样性监测与野生动物保护研究提供统一的计算资源。该数据集汇集了来自多个研究机构与保护组织的子集,如Caltech Camera Traps、Snapshot Serengeti等,覆盖从北美到非洲的广泛地理区域,涉及数百个物种。其核心研究问题在于通过标准化分类体系解决相机陷阱数据在机器学习应用中的异构性挑战,推动计算机视觉技术在生态学领域的深入应用,显著提升了物种自动识别与种群监测的科研效率。
当前挑战
该数据集致力于解决野生动物图像分类中的复杂挑战,包括物种在自然环境中因姿态、光照、遮挡等因素导致的识别困难,以及数据中大量空图像(无动物)带来的类别不平衡问题。在构建过程中,面临多源数据整合的艰巨任务,需统一不同子集的分类标准与标注格式,同时处理图像中涉及人类隐私内容的敏感信息移除,并确保跨地域、跨生态系统的数据代表性,以支撑稳健的机器学习模型训练。
常用场景
经典使用场景
在生态学与计算机视觉的交叉领域,LILA Camera Traps数据集作为首个整合多源相机陷阱数据的统一平台,为野生动物监测提供了标准化训练环境。其经典应用场景聚焦于自动化物种识别模型的开发与评估,研究者利用该数据集训练深度神经网络,实现对相机陷阱图像中动物类别的精准分类,有效解决了野外环境中因光照变化、遮挡和背景复杂导致的识别难题。
解决学术问题
该数据集通过聚合全球不同生态区域的相机陷阱图像,系统性地应对了生物多样性研究中数据碎片化的挑战。它使得跨地域物种分布比较、种群动态建模以及栖息地利用分析成为可能,为生态学家提供了大规模、多标签的视觉数据基础。其统一分类体系显著提升了机器学习模型在未知环境中的泛化能力,推动了计算机视觉在非受控自然场景下的理论进展。
衍生相关工作
围绕该数据集衍生的经典工作包括跨数据集域自适应方法的研究,如Beery等人提出的‘Terra Incognita’框架,旨在提升模型在新地理区域的识别鲁棒性。此外,Tabak等人利用该数据开发了高效物种分类管道,推动了机器学习在生态学中的标准化应用。后续研究进一步探索了少样本学习与序列分析技术,以应对数据不平衡和时序行为建模等问题,持续拓展了相机陷阱数据分析的深度与广度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作