five

PanAf-FGBG Dataset|野生动物行为识别数据集|视频数据分析数据集

收藏
arXiv2025-03-03 更新2025-03-05 收录
野生动物行为识别
视频数据分析
下载链接:
http://arxiv.org/abs/2502.21201v2
下载链接
链接失效反馈
资源简介:
PanAf-FGBG数据集是由布里斯托尔大学等机构合作创建的,包含20小时野生黑猩猩行为的视频数据,共5070对前后景视频。每对视频均来自同一摄像机位置,其中前景区有黑猩猩,后景区无黑猩猩。该数据集提供了丰富的行为注释和场景描述元数据,旨在研究背景信息对野生动物行为识别的影响。
提供机构:
布里斯托尔大学、野生动物基金会、莱比锡大学等
创建时间:
2025-03-01
AI搜集汇总
数据集介绍
main_image_url
构建方式
PanAf-FGBG数据集的构建方式独特而精细,它从非洲六个国家的十四个国家公园和超过350个独立的相机位置收集了20小时的黑猩猩行为视频。每个包含黑猩猩的短视频(称为前景视频)都与一个来自同一相机位置但没有黑猩猩的相应背景视频配对。这种配对方法允许研究背景信息对行为识别模型的影响,并首次直接评估在分布内和分布外条件下的表现。数据集提供了两种视图:一种具有重叠的相机位置,另一种具有不重叠的位置。所有视频片段都附带丰富的行为注释和元数据,包括唯一的相机ID和详细的文本场景描述。
特点
PanAf-FGBG数据集的特点在于其独特的配对设置,它提供了前景-背景视频对,使得研究人员可以系统地分析背景信息对野生动物行为识别的影响。数据集包含丰富的行为注释和元数据,包括独特的相机ID和详细的文本场景描述。此外,数据集还提供了两种视图:一种具有重叠的相机位置,另一种具有不重叠的位置,这为评估模型在分布内和分布外条件下的表现提供了可能性。最后,数据集还提供了多个基线模型和一个高效的潜在空间归一化技术,该技术可以提高模型在分布外情况下的性能。
使用方法
使用PanAf-FGBG数据集的方法包括:首先,数据集提供了两种视图,研究人员可以根据需要选择重叠或非重叠的相机位置视图进行实验。其次,数据集附带丰富的行为注释和元数据,研究人员可以利用这些信息进行行为识别和分类任务。最后,数据集还提供了多个基线模型和一个高效的潜在空间归一化技术,研究人员可以利用这些工具来提高模型在分布外情况下的性能。
背景与挑战
背景概述
野生动物保护领域中,利用相机陷阱视频进行行为分析对于监测种群健康变化至关重要。然而,现有的动物行为数据集和方法大多忽视了行为相关背景信息及其对泛化能力的影响。针对这一空白,Otto Brookes等研究人员于2025年创建了PanAf-FGBG数据集,该数据集收录了来自六个非洲国家、14个国家公园和超过350个独立相机位置的野生黑猩猩行为视频,共计20小时。独特之处在于,每个包含黑猩猩(前景视频)的视频都配有一个来自同一相机位置的无黑猩猩(背景视频)。这种设置首次允许直接评估分布内和分布外条件,并量化背景信息对行为识别模型的影响。所有视频片段都附有丰富的行为注释和元数据,包括独特的相机ID和详细的文本场景描述。该数据集的发布对于野生动物行为识别领域具有重要意义,有助于提高模型在复杂环境下的泛化能力。
当前挑战
PanAf-FGBG数据集面临的挑战包括:1) 行为识别模型对背景信息的过度依赖,导致模型在分布外数据上的表现显著下降;2) 构建过程中遇到的挑战,如数据收集、标注和合成背景视频等。为了解决这些挑战,研究人员进行了深入的实验,并提出了一个有效的潜在空间归一化技术,该技术通过在潜在空间中对背景信息进行归一化,显著提高了模型在分布外数据上的表现。此外,研究还发现,背景持续时间(即前景视频中无演员的背景帧数量)对行为识别模型的影响尚未得到充分探索。因此,未来的研究需要进一步探讨背景信息在行为识别中的作用,以及如何有效地利用背景信息提高模型的泛化能力。
常用场景
经典使用场景
PanAf-FGBG数据集在野生动物行为识别领域具有广泛的应用前景。该数据集的独特之处在于它包含了配对的背景视频,使得研究人员能够评估背景信息对行为识别模型的影响。经典的使用场景包括:1. 训练和评估野生动物行为识别模型;2. 研究背景信息对模型性能的影响;3. 探索如何通过背景信息提升模型在未知环境下的泛化能力。
实际应用
PanAf-FGBG数据集在实际应用场景中具有广泛的应用前景。例如,在野生动物保护领域,该数据集可以用于监测和识别野生动物的行为,从而帮助研究人员更好地了解野生动物的生态环境和行为模式。此外,该数据集还可以用于训练和评估野生动物行为识别模型,从而提高模型在未知环境下的泛化能力,为野生动物保护提供有力的技术支持。
衍生相关工作
PanAf-FGBG数据集的发布衍生了许多相关的经典工作。例如,研究人员可以利用该数据集探索如何通过背景信息提升模型在未知环境下的泛化能力,以及如何设计更有效的行为识别模型。此外,该数据集还可以用于开发新的野生动物行为识别算法,从而推动野生动物保护领域的技术进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Global Solar Dataset

在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。

github 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录