wildetect

Hugging Face2026-05-10 更新2026-05-11 收录

下载链接：

https://huggingface.co/datasets/fadel841/wildetect

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在通过南非草原的无人机航拍图像，评估机器学习模型在多物种野生动物检测和识别中的应用。数据采集使用DJI Matrice 300 RTK无人机搭载Zenmuse P1 45MP RGB相机完成，飞行高度180米，地面采样距离为2.3厘米。数据集包含干季（2023年10月）和湿季（2024年2月）的多次飞行数据，以及额外的算法训练飞行数据。原始图像按季节、地点（Kapiri或LeopardRock）、营地组和重复次数分类存储。图像经过分块处理，并使用Label Studio标注为边界框，标注文件以COCO和Label Studio格式提供。数据集包含多个压缩文件，总计约53.98GB，涵盖1872至1470个样本不等的多个子集。适用于计算机视觉和野生动物监测相关任务。

This dataset aims to evaluate the application of machine learning models in multi-species wildlife detection and recognition through drone aerial images of the South African grassland. Data collection was completed using a DJI Matrice 300 RTK drone equipped with a Zenmuse P1 45MP RGB camera, with a flight altitude of 180 meters and a ground sampling distance of 2.3 centimeters. The dataset includes multiple flight data from the dry season (October 2023) and wet season (February 2024), as well as additional algorithm training flight data. Original images are classified and stored by season, location (Kapiri or LeopardRock), camp group, and repetition count. The images are processed into patches and annotated as bounding boxes using Label Studio, with annotation files provided in COCO and Label Studio formats. The dataset contains multiple compressed files, totaling approximately 53.98GB, covering multiple subsets with samples ranging from 1872 to 1470. It is suitable for computer vision and wildlife monitoring-related tasks.

创建时间：

2026-05-09

原始信息汇总

数据集概述：Wildetect

该数据集用于评估机器学习模型在南非稀树草原遥感天底图像上进行多物种野生动物检测与识别的性能。

数据集基本信息

许可证: Apache-2.0
数据集DOI: 10.5061/dryad.9ghx3ffvc
总下载大小: 约53.98 GB
总数据集大小: 约53.98 GB

数据来源与采集

无人机设备: DJI Matrice 300 RTK 无人机，搭载 DJI Zenmuse P1 45MP RGB 相机
飞行参数: 预设航线，前向重叠70%，侧向重叠53%，飞行速度11 m/s，飞行高度180米，地面采样距离（GSD）2.3 cm
采集时间: 旱季（2023年10月2-5日）和雨季（2024年2月4-6日），每个区域各飞行3次
采集地点: Kapiri 和 LeopardRock 两个区域

数据集结构

特征字段

字段名	类型	说明
file_name	string	文件名
image	image	图像数据
class_id	list of int32	类别ID
annotations	list of list of float32	标注信息（边界框）

数据划分（Split）

划分名称	示例数	字节数
DryseasonKapiriCamp145rep1	1,872	约19.91 GB
DryseasonKapiriCamp68rep1	248	约2.89 GB
DryseasonKapiriCamp911rep1	1,470	约14.94 GB
DryseasonKapiriCamp6extradata	919	约16.24 GB

文件构成

原始图像按以下层级组织：

季节: 旱季（Dry）/ 雨季（Wet）
区域: Kapiri / LeopardRock
营地组: CampX-Y
重复次数: Rep1-3

主要文件类型

原始图像压缩包: 如 Dry_Kapiri.zip、Wet_Leopard_Rock.zip 等
分块图像文件: 包含 "tiled" 标识的文件
标注文件: Annotations.zip（包含 COCO 和 Label Studio 格式）
统计文件: stats.xlsx（显示旱季不同地点和军营检测到的物种与特征）

数据预处理

原始图像通过 Python 脚本进行分块（tiling）
使用 Label Studio（www.lablestud.io）进行边界框标注
标注包含训练集、测试集和验证集的划分

相关代码

数据分块、预处理及算法训练的代码可在 GitHub 获取：https://github.com/FadelMamar/wildetect

搜集汇总

数据集介绍

构建方式

Wildetect数据集的构建源于南非稀树草原生态系统中无人机遥感影像的实地采集。研究团队利用搭载DJI Zenmuse P1 45MP RGB相机的大疆Matrice 300 RTK无人机，以180米飞行高度、2.3厘米地面采样距离和70%航向重叠率预设航线，先后于2023年旱季与2024年雨季对多个营地进行了三次重复拍摄。原始影像经Python脚本切片处理后，借助Label Studio工具以边界框形式标注了多物种目标。标注结果以COCO与Label Studio双格式存储于Annotations.zip中，并依据论文所述策略划分为训练、验证与测试子集。数据集还包含无人机自动记录的额外飞行参数文件，这些文件通过文件名中的'extradite'字段加以标识，从而构建了体系完整的多物种野生动物检测基准库。

特点

Wildetect数据集具备突出的系统性、多样性与代表性。其图像数据覆盖Kapiri与Leopard Rock两大产权地，囊括旱季与雨季两个季节，并包含多个营地的重复航次，充分反映了不同环境条件下物种分布的时空异质性。影像空间分辨率高达2.3厘米，使得大型哺乳动物乃至微小特征均可精确定位与识别。数据集内各样本不仅包含原始图像文件名与标注信息，还以整数数组存储类别ID，并以浮点数列表记录边界框坐标，结构严谨。此外，额外飞行数据的加入为算法训练提供了更为丰富的样本来源，从而显著提升了模型在复杂场景下的泛化能力，是少有的结合了遥感成像规范与生态学多目标标注的高质量基准资源。

使用方法

Wildetect数据集可通过HuggingFace平台以默认配置直接加载，用户需指定数据拆分（如DryseasonKapiriCamp145rep1）并调用相关路径读取图像与标注文件。图像数据以zip压缩包形式按季节、产权地与营地进行组织，解压后可使用Python图像库加载。标注信息存储于Annotations.zip内，用户可基于COCO格式解析边界框与类别ID，进而导入常见目标检测框架（如MMDetection、Detectron2）进行模型训练与评估。同时，GitHub仓库（https://github.com/FadelMamar/wildetect）提供了影像切片、预处理与算法训练的完整代码，支持用户复现论文实验或扩展至自定义物种识别任务，降低了生态遥感与深度学习交叉领域的应用门槛。

背景与挑战

背景概述

wildetect数据集诞生于2023至2024年间，由研究团队在南非萨凡纳地区运用无人机遥感技术采集而成，旨在解决多物种野生动物检测与识别的核心研究问题。该数据集利用DJI Matrice 300 RTK无人机搭载Zenmuse P1 45MP RGB相机，以2.3厘米的地面采样距离获取俯视影像，覆盖卡皮里和豹岩两大保护区的多个营地。通过干湿两季的重复飞行与额外训练数据采集，系统性地构建了包含边界框标注的高质量图像库。作为野生动物自动监测领域的标杆资源，wildetect为评估机器学习模型在复杂自然场景中的泛化能力提供了关键基准，推动了生态保护与计算机视觉的交叉研究，对实现非侵入式种群调查与栖息地管理具有深远影响。

当前挑战

wildetect数据集所应对的领域挑战在于，传统地面普查方法难以高效覆盖广袤稀树草原，而无人机遥感虽能获取高频图像，但多物种的精准检测与识别仍受制于目标尺度微小、伪装色与环境相似度高以及季节植被变化带来的视觉干扰。构建过程中，技术团队面临多重难题：需在干湿两季重复飞行以保障数据多样性，同时通过70%前向与53%侧向重叠的航线规划确保图像拼接质量；大量原始影像需经Python脚本切片并利用Label Studio手工标注边界框，处理过程耗时且易引入标注不一致性；此外，不同营地和重复实验间的数据组织、以及训练-验证-测试集的合理划分，都对数据管道的稳定性提出了严苛要求。

常用场景

经典使用场景

wildetect数据集专为多物种野生动物检测与识别任务而构建，其核心应用场景是基于无人机遥感俯视影像的智能生态监测。该数据集聚焦于南非稀树草原生态系统，利用高分辨率RGB相机采集的影像，辅以精确的边界框标注，为训练和评估目标检测模型提供了丰富多样的样本。经典使用方式在于利用该数据集训练能够同时识别多种大型野生动物（如羚羊、犀牛等）的深度神经网络，特别适用于在复杂自然背景下从航拍图像中精确检测并区分不同物种个体。

实际应用

在实际应用中，wildetect数据集所支持的模型可直接部署于无人机载实时监测系统，用于非洲自然保护区或游牧区域的野生动物种群计数、分布跟踪及行为分析。例如，保护机构可利用训练好的检测算法自动处理每日航拍数据，快速识别个体并预警偷猎活动或物种迁徙。此外，该数据集还可服务于生态影响评估，通过对比不同季节和区域的检测结果，辅助决策者制定科学的草场管理或栖息地恢复计划，从而在保护生物多样性与促进可持续旅游之间取得平衡。

衍生相关工作

基于wildetect数据集，研究者已衍生出多项代表性工作。例如，数据集随附的GitHub仓库开源了影像切分、预处理及多种机器学习模型（包括卷积神经网络和Transformer架构）的训练代码，促进了算法复现与改进。相关论文重点评估了模型在俯视影像上跨季节泛化能力，并比较了不同标注格式（如COCO和Label Studio）对训练效率的影响。这一数据集还启发了后续关于小样本学习、域自适应分类器以及轻量化模型（适配机载边缘设备）的探索，成为南非常见野生动物自动检测领域的基准资源，推动了生态计算机视觉方法的持续演进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集