five

BAMBI Dataset

收藏
github2026-03-12 更新2026-03-05 收录
下载链接:
https://github.com/bambi-eco/Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
BAMBI数据集是一个大规模的多光谱航空野生动物数据集,包含389对RGB和热成像航空视频序列,记录于奥地利各种森林和森林邻近栖息地。每帧都带有精确的全球坐标(经度、纬度和高度),支持在图像空间和地理空间中进行学习和评估。

The BAMBI dataset is a large-scale multi-spectral wildlife dataset that comprises 389 pairs of RGB and thermal infrared aerial video sequences, captured in diverse forest and forest-adjacent habitats across Austria. Each frame is annotated with precise global coordinates including longitude, latitude and altitude, which enables learning and evaluation in both image space and geographic space.
创建时间:
2026-02-13
原始信息汇总

BAMBI 数据集概述

数据集简介

BAMBI 数据集是一个大规模机载多光谱野生动物数据集,包含 389 个配对的 RGB 和热成像航空视频序列,记录于奥地利多样化的森林及森林邻近栖息地。每个帧都带有精确的全球坐标(经度、纬度和海拔)地理参考,支持在图像空间和地理空间中进行学习和评估。

数据集概览

属性 数值
视频序列 389 个配对的 RGB + 热成像
总飞行时间 ~45 小时
标注轨迹 5,100 条
关键帧 92,701 帧
插值边界框 1,218,903 个
物种类别 12 类
记录时间 2023年1月 – 2024年11月
记录地点 奥地利(蒂罗尔州、上奥地利州、下奥地利州、萨尔茨堡州、施蒂利亚州、克恩顿州)

物种覆盖

数据集涵盖以下 12 个类别:

# 物种 通用名 Wikidata 轨迹数 关键帧数
1 Sus scrofa 野猪 Q58697 1,770 26,132
2 Cervus elaphus 马鹿 Q1219579 1,613 26,674
3 Capreolus capreolus Q122069 682 9,404
4 Dama dama 黇鹿 Q20908334 297 20,003
5 Capra ibex 阿尔卑斯野山羊 Q168327 100 3,005
6 Rupicapra rupicapra 岩羚羊 Q131340 15 747
7 Aves 鸟类 Q5113 75 942
8 Homo sapiens 人类 Q15978631 93 1,158
9 Canis lupus familiaris Q26972265 7 95
10 Sus scrofa × Sus domesticus 杂交猪 Q602666 44 1,484
11 非动物 Q10738 60 521
12 未知 Q24238356 344 2,536

标注格式

标注以 CSV 文件(无表头)形式存储,遵循自定义的多目标跟踪格式:

frame, track_id, bb_left, bb_top, bb_width, bb_height, conf, class_id, visibility, species, gender, age, is_propagated

列名 类型 描述
frame int 帧索引
track_id int 唯一轨迹标识符
bb_left int 边界框左坐标(像素)
bb_top int 边界框顶坐标(像素)
bb_width int 边界框宽度(像素)
bb_height int 边界框高度(像素)
conf float 置信度分数
class_id int 物种类别标识符
visibility float 可见度(1.0 = 完全可见,0.0 = 完全遮挡)
species str 物种名称
gender int 性别(0 = 未知,1 = 雄性,2 = 雌性)
age int 年龄(0 = 未知,1 = 幼年,2 = 成年)
is_propagated int 0 = 标注的关键帧,1 = 插值帧

类别标识符定义为 <wikidata_id>-<gender>-<age>-<visibility>,具体映射关系详见 README 中的 JSON 结构。

数据可用性

数据集在 Zenodo 上公开可用:

  • https://doi.org/10.5281/zenodo.18692354
  • https://doi.org/10.5281/zenodo.18698508
  • https://doi.org/10.5281/zenodo.18703312
  • https://doi.org/10.5281/zenodo.18705705
  • https://doi.org/10.5281/zenodo.18707610
  • https://doi.org/10.5281/zenodo.18711217
  • https://doi.org/10.5281/zenodo.18715162
  • https://doi.org/10.5281/zenodo.18717601

数据处理脚本

该仓库提供了用于下载、处理和可视化数据集的示例脚本。主要功能包括:

  • 自动下载:从 Zenodo 选择性下载飞行数据 ZIP 文件。
  • 飞行筛选:根据物种、遮挡、性别、年龄、天气、日期范围和无人机名称筛选飞行数据。
  • 帧提取:从并排视频文件中提取热成像和 RGB 帧。
  • MOT 插值:使用边界框坐标的线性插值在标注的关键帧之间填充缺失帧。
  • MOT 筛选:按物种、类别 ID、可见度、边界框大小、性别或年龄筛选标注文件。
  • MOT 到 YOLO 转换:将 MOT 标注转换为 YOLO 标签格式。
  • 可视化:在提取的帧或视频上叠加边界框。
  • 从位姿生成 DEM:根据位姿文件中的 GPS 坐标下载、合并和裁剪数字高程模型数据。
  • 在位姿中添加相对 DEM 位置:基于 DEM 元数据将相对位置偏移添加到无人机位姿文件。

RGB-热成像帧匹配说明

尽管无人机同时记录 RGB 和热成像图像,但两种模态在时间上并不同步。时间偏移随飞行动态变化,因此热成像帧的标注不能直接转移到 RGB 图像——必须在序列或帧级别建立对应关系。数据集包含一种基于局部块匹配的策略来对齐热成像标注与其 RGB 对应部分。

相关资源

  • BAMBI BBox Corrections:https://github.com/HugoMarkoff/BAMBI_BBox_Corrections
  • AlfsPY:https://github.com/bambi-eco/alfs_py
  • Detection:https://github.com/bambi-eco/bambi_detection
  • Geo-Referenced Tracking:https://github.com/bambi-eco/Geo-Referenced-Tracking
  • Bambi-QGIS:https://github.com/bambi-eco/Bambi-QGIS

引用

bibtex @inproceedings{bambi2026, title = {The BAMBI Dataset: Multimodal Nadir UAV-Recordings of Forest Wildlife}, author = {TODO}, booktitle = {TODO}, year = {2026} }

许可证

此仓库采用 MIT 许可证。

搜集汇总
数据集介绍
main_image_url
构建方式
在森林野生动物监测领域,BAMBI数据集通过无人机航拍技术构建而成,其采集过程覆盖了奥地利境内多样化的森林及邻近栖息地。数据采集历时近两年,共获取了389对同步记录的RGB与热成像视频序列,总飞行时长约45小时。每帧图像均附有精确的地理坐标信息,包括经度、纬度和海拔高度,实现了图像空间与地理空间的双重映射。数据标注采用了关键帧标注与线性插值相结合的策略,首先对92,701个关键帧进行人工标注,随后通过插值算法生成了超过121万个人工标注框,形成了完整的运动目标跟踪轨迹。
特点
该数据集的核心特点在于其多模态与地理信息的深度融合。它不仅提供了高分辨率的RGB图像与热成像数据对,还包含了丰富的元数据,如物种、性别、年龄及可见度等细粒度属性。数据集涵盖了12个物种类别,包括野猪、马鹿、狍子等典型森林动物,并引入了“非动物”与“未知”类别以增强现实场景的复杂性。标注格式遵循自定义的MOT标准,每个边界框均关联了Wikidata标识符,确保了数据的可追溯性与语义一致性。此外,数据集的时空覆盖广泛,记录了不同季节与天气条件下的野生动物活动,为模型鲁棒性评估提供了坚实基础。
使用方法
为便于研究人员使用,数据集提供了完整的工具链支持。用户可通过Python脚本从Zenodo平台选择性下载数据,并利用过滤工具根据物种、遮挡状态、性别等条件筛选特定飞行序列。数据预处理包括帧提取、标注插值与格式转换等功能,支持将MOT标注转换为YOLO格式以适配主流检测模型。可视化工具允许用户在单帧或视频上叠加边界框,直观验证标注质量。对于高级应用,配套工具支持基于数字高程模型的地理空间分析,以及RGB与热成像帧之间的局部配准,为多模态融合研究提供了技术保障。
背景与挑战
背景概述
在生态监测与计算机视觉交叉领域,森林野生动物的自动化监测长期面临数据稀缺的挑战。BAMBI数据集应运而生,由奥地利研究团队于2023年1月至2024年11月期间创建,旨在通过无人机平台采集大规模、多模态的森林野生动物航拍数据。该数据集包含389对RGB与热成像视频序列,覆盖奥地利六个州的不同森林生境,记录了约45小时飞行数据,并标注了超过120万个人工智能可读的边界框,涉及野猪、马鹿、狍子等12个物种类别。其核心研究问题聚焦于复杂森林环境下野生动物的多目标检测、跟踪与多模态融合,为野生动物保护、种群动态分析和自动驾驶环境感知等领域提供了宝贵的基准数据。
当前挑战
BAMBI数据集致力于解决森林野生动物多模态检测与地理空间跟踪这一领域核心问题,其面临的首要挑战在于复杂环境下的模型泛化能力。茂密植被导致的严重遮挡、光照条件剧烈变化以及动物姿态多样性,均对检测算法的鲁棒性构成严峻考验。在数据构建过程中,研究人员需克服多模态数据对齐的困难,由于RGB与热成像传感器并非严格同步,需设计复杂的局部块匹配策略以实现跨模态标注的精确传递。此外,在广袤且地形多变的森林区域进行系统性数据采集,涉及无人机路径规划、海量数据存储与精细化标注,这些工程实践同样构成了数据集构建的重要挑战。
常用场景
经典使用场景
在森林野生动物监测领域,BAMBI数据集为多模态目标检测与追踪算法提供了理想的验证平台。其经典应用场景集中于利用无人机搭载的RGB与热成像双传感器,对奥地利森林环境中的12类野生动物进行俯视角连续拍摄与标注。研究者可基于该数据集开发鲁棒的跨模态融合模型,解决复杂林下环境中因光照变化、遮挡等因素导致的单一模态识别失效问题。数据集提供的精确地理坐标与时间序列信息,进一步支持了从图像空间到地理空间的联合学习与评估。
实际应用
在实际应用层面,BAMBI数据集支撑的技术方案可直接服务于现代森林管理与生物多样性保护。基于其训练的智能监测系统能够部署于自然保护区,实现野猪、马鹿等关键物种种群数量的自动化普查与动态追踪,显著提升监测效率并降低人力成本。数据集衍生的地理参考追踪算法,可帮助生态学家精准绘制动物活动热力图与迁徙走廊,为栖息地修复与人类活动干扰评估提供数据驱动决策支持。此外,该技术框架亦可扩展至农林牧业中的野生动物损害预警与防控场景。
衍生相关工作
围绕BAMBI数据集已衍生出一系列具有影响力的相关研究工作。例如,配套发布的AlfsPY框架实现了基于无人机记录的鸟瞰投影与光场渲染,为三维场景理解提供了新工具。Geo-Referenced Tracking项目则专注于融合局部图像特征与全球坐标的追踪算法,探索了视觉目标在物理空间中的连续定位问题。此外,BAMBI BBox Corrections仓库提出的局部块匹配策略,有效解决了RGB与热成像帧间非同步对齐的技术挑战。这些工作共同构建了一个从数据采集、处理到高级应用分析的完整技术生态。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作