SA-FARI
收藏arXiv2025-11-20 更新2025-11-21 收录
下载链接:
https://huggingface.co/datasets/facebook/SA-FARI
下载链接
链接失效反馈官方服务:
资源简介:
SA-FARI是由保护X实验室联合多家科研机构构建的全球最大野生动物多目标追踪开源数据集。该数据集包含来自4大洲741个监测点、跨越99个物种的11,609段摄像机陷阱视频,总时长达46小时,涵盖16,224个掩码轨迹标识和94万多个边界框与分割掩码标注。数据集通过SAM 3数据引擎进行半自动标注,结合人工校验确保空间分割精度,其创建过程整合了十年间(2014-2024)跨地域生态监测数据。该资源致力于推动通用化多动物追踪模型发展,为野生动物保护中的个体重识别、行为分析和种群监测提供关键基础。
SA-FARI is the world's largest open-source dataset for multi-object wildlife tracking, developed by Conservation X Lab in collaboration with multiple research institutions. This dataset comprises 11,609 camera trap videos from 741 monitoring sites across four continents, spanning 99 species, with a total duration of 46 hours. It encompasses 16,224 masked trajectory annotations and over 940,000 bounding box and segmentation mask annotations. The dataset was semi-automatically annotated using the SAM 3 data engine, paired with manual verification to ensure accurate spatial segmentation. Its creation integrated cross-regional ecological monitoring data collected over the 10-year period from 2014 to 2024. This resource aims to advance the development of generalized multi-animal tracking models, providing a critical foundation for individual re-identification, behavioral analysis, and population monitoring in wildlife conservation.
提供机构:
保护X实验室、Meta、布里斯托大学
创建时间:
2025-11-20
搜集汇总
数据集介绍

构建方式
在野生动物保护领域,自动化视频分析对生态监测至关重要。SA-FARI数据集通过整合来自四大洲741个独立采样点的11,609段相机陷阱视频构建而成,数据采集时间跨度长达十年(2014-2024年)。构建过程采用标准化生态调查方法,相机陷阱布设于野生动物活动路径,涵盖地面与树冠多层生境。视频数据经过多阶段人工标注流程:首先由领域专家确认物种类别,随后通过SAM 3数据引擎以6帧/秒的速率生成初始分割掩码,再经过两轮独立人工校验与精细化修正,最终形成包含16,224个掩码序列的高质量时空标注。
特点
该数据集在生态计算机视觉领域具有里程碑意义,其最显著特点是前所未有的时空多样性与标注完整性。涵盖99个动物物种类别,包含哺乳类、鸟类、爬行类和两栖类四大纲,呈现典型的长尾分布特征。数据集提供942,702个实例级标注,包括边界框、分割掩码和个体身份标识,其中46小时密集标注视频包含大量复杂场景:多动物共存、部分遮挡、夜间红外成像及动态模糊等挑战性条件。特别值得关注的是,该数据集首次在野生动物追踪领域实现了大规模人工验证的分割标注,其掩码序列平均交并比达0.7以上,确保了空间标注的精确性。
使用方法
该数据集为多动物追踪研究提供了标准化评估框架。研究人员可采用两种典型应用范式:基于物种特定提示的视觉语言模型评估,将物种名称作为查询条件进行实例分割与追踪;或采用物种无关的通用检测方法,使用“动物”类通用提示进行跨物种实例定位。数据集按相机陷阱位置严格划分训练测试集,确保生态分布独立性,并额外提供夜间、多目标、大/小目标等五个挑战性子集用于细粒度性能分析。基准测试表明,在SA-FARI上微调的SAM 3模型在cgF1指标上相较基线提升32.9个百分点,显著增强了模型在真实野外环境中的泛化能力。
背景与挑战
背景概述
随着全球生物多样性以空前速度衰退,野生动物保护领域对自动化视频分析技术的需求日益迫切。SA-FARI数据集由Conservation X Labs联合Meta、布里斯托大学等机构于2024年共同发布,旨在解决野生动物多目标追踪领域缺乏大规模标注数据的核心问题。该数据集整合了2014至2024年间从四大洲741个监测点采集的11,609段相机陷阱视频,涵盖99个物种类别,提供超过16,000个精确标注的时空掩码轨迹。其跨地域、跨物种的生态多样性特征,为开发通用型动物追踪模型奠定了前所未有的数据基础。
当前挑战
在领域问题层面,传统野生动物追踪面临三大挑战:现有数据集受限于物种单一性、地理覆盖狭窄与标注时长不足,难以支撑野外复杂环境下的模型泛化;动态场景中动物遮挡、运动模糊与夜间低光照条件显著降低追踪精度;长尾物种数据稀缺导致模型对稀有生物识别能力薄弱。在构建过程中,团队需克服多源相机陷阱数据标准化整合、跨物种掩码标注一致性维护,以及海量视频帧级人工校验等工程难题,最终通过SAM 3数据引擎与多轮人工校验的混合标注策略实现高质量标注。
常用场景
经典使用场景
在野生动物保护领域,SA-FARI数据集为多动物跟踪研究提供了前所未有的基准平台。该数据集通过整合来自四大洲741个监测点的11,609段相机陷阱视频,构建了包含99个物种类别、16,224个个体标识的密集标注体系。研究者可利用其时空分割标注开展跨物种行为模式分析,特别是在处理夜间活动、群体互动等复杂场景时,数据集提供的精确掩码序列能够有效支撑动物运动轨迹重建与个体身份保持。
解决学术问题
该数据集有效解决了野生动物计算机视觉研究中长期存在的标注稀缺与地理局限性问题。通过提供跨越十年的多区域观测数据,显著缓解了模型在跨物种泛化、遮挡处理及运动模糊等场景下的性能衰减。其手工验证的时空分割标注为开发鲁棒的多目标跟踪算法奠定了数据基础,特别是在应对自然环境中光照变化、植被遮挡等挑战时,为模型优化提供了关键监督信号。
衍生相关工作
该数据集的发布催生了多项野生动物分析领域的创新研究。基于SA-FARI训练的SAM 3模型在开放词汇分割任务中实现了68.1 pHOTA的突破性性能,显著优于传统检测器与跟踪器组合。后续研究进一步拓展了多模态融合方向,结合音频信号与视觉特征开发跨模态个体识别系统,为复杂环境下的野生动物监测提供了新的技术范式。
以上内容由遇见数据集搜集并总结生成



