marco-willi/ser_balanced

Name: marco-willi/ser_balanced
Creator: marco-willi
Published: 2026-04-24 22:16:13
License: 暂无描述

Hugging Face2026-04-24 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/marco-willi/ser_balanced

下载链接

链接失效反馈

官方服务：

资源简介：

Snapshot Safari SER (Serengeti) — Balanced Classroom Subset v1.0是一个精选的、平衡的Snapshot Safari 2024 Expansion SER（塞伦盖蒂国家公园）相机陷阱数据集的子集，专为CAS深度学习-计算机视觉课程练习准备。数据集包含1,850张图像，分为10个类别（水牛、大象、空场景、格兰特瞪羚、汤姆森瞪羚、狷羚、黑斑羚、疣猪、蓝角马、平原斑马），每个类别最多200张图像。数据集经过MegaDetector过滤，确保动物置信度≥0.8，并分为训练集（70%）、验证集（15%）和测试集（15%）。图像分辨率调整为长边最大1024像素，JPEG质量92，格式为ImageFolder布局。

Snapshot Safari SER (Serengeti) — Balanced Classroom Subset v1.0 is a curated, balanced subset of the Snapshot Safari 2024 Expansion SER (Serengeti National Park) camera trap dataset, prepared for use in the CAS Deep Learning — Computer Vision course exercises. The dataset contains 1,850 images divided into 10 classes (buffalo, elephant, empty, gazellegrants, gazellethomsons, hartebeest, impala, warthog, wildebeestblue, zebraplains), with a maximum of 200 images per class. The dataset is filtered using MegaDetector to ensure animal confidence ≥ 0.8 and is split into training (70%), validation (15%), and test (15%) sets. Images are resized to a maximum of 1024 px on the longer side with JPEG quality 92 and formatted in ImageFolder layout.

提供机构：

marco-willi

搜集汇总

数据集介绍

构建方式

该数据集源自Snapshot Safari 2024 Expansion项目在坦桑尼亚塞伦盖蒂国家公园部署的相机陷阱图像，经由MegaDetector v1000-redwood模型进行动物目标检测，筛选出置信度不低于0.8的帧，并选取每个拍摄序列中动物置信度最高的唯一图像，同时剔除动物置信度低于0.2的空白帧。在此基础上，针对十个物种类别（包括水牛、大象、瞪羚等）以及空类进行平衡采样，每类别最多包含200张图像，空类仅保留50张以维持类别间相对均衡。图像被调整至长边不超过1024像素，JPEG质量设为92，并按70/15/15比例以序列为单位分层划分为训练、验证和测试集，确保同一序列的图像不会跨分割集合。

特点

数据集呈现两大核心特点：其一为类别平衡性，九个动物类每类恰好200张图像，空类仅50张，合计1850张图像，有效缓解了相机陷阱数据中常见的类别极度不均衡问题；其二为高置信度筛选与去冗余，通过MegaDetector的深度检测结果过滤掉低质量帧，并保留每序列最优帧，避免了时间序列上的强相关性。此外，约56%的图像为红外夜拍模式，呈现近单色灰度风格，增添了光照条件多样性。数据集存储为标准的ImageFolder目录结构，即训练/验证/测试集下按类别名称组织子文件夹，便于直接加载。

使用方法

用户可通过Hugging Face Hub的`hf_hub_download`函数下载压缩包`ser_balanced.tar.gz`，随后利用Python的`tarfile`库解压至指定路径。解压后得到`ser/ser_balanced/`目录，内含`train`、`val`、`test`三个子文件夹，每个子文件夹下按类别名称（如`buffalo`、`elephant`）存放JPEG图像。依托PyTorch的`torchvision.datasets.ImageFolder`或TensorFlow的`keras.utils.image_dataset_from_directory`等工具，即可直接构建图像分类数据加载器，适用于计算机视觉课程中的监督学习练习，无需额外处理元数据或标签映射。

背景与挑战

背景概述

该数据集诞生于野生动物自动监测领域对高效、鲁棒计算机视觉模型的迫切需求，由Snapshot Safari项目与明尼苏达大学狮子中心于2024年共同创建，核心研究问题聚焦于在类别不均衡的相机陷阱图像中实现稳健的物种识别。ser_balanced作为Snapshot Safari 2024 Expansion中塞伦盖蒂国家公园子集的平衡版，精心挑选了10个常见物种或类别（含空镜头），每类最多200张图像，总计1,850张，特别适用于计算机视觉课程中的深度学习实践。其影响力体现在为教育场景提供了标准化、可复现的基准数据，弥补了大型原始数据集在课堂环境中难以直接使用的缺憾。

当前挑战

该数据集首先解决了相机陷阱图像分析中长期存在的类别不平衡挑战——原始数据中稀有物种样本稀少而常见物种样本冗余，严重影响模型泛化能力；通过每类样本上限控制（≤200）与空镜头类别刻意缩减至50张，强制模型学习更具判别力的特征。构建过程中，研究团队面临序列去重的技术难题：利用MegaDetector v1000的动物置信度分数，从每个触发序列中选取置信度≥0.8的最高帧，并设定0.2的阈值区分空镜头，再通过序列ID分层抽样（70/15/15）确保训练、验证、测试集无序列交叉，同时应对大量红外夜拍图像（约56%）带来的色彩信息缺失挑战。

常用场景

经典使用场景

ser_balanced数据集是Snapshot Safari 2024 Expansion项目中塞伦盖蒂国家公园相机陷阱影像的精炼子集，专为计算机视觉课程中的深度学习实践而设计。其经典使用场景集中于图像分类任务，研究人员可借此训练模型区分十类常见草原野生动物，包括非洲水牛、大象、汤姆森瞪羚等，并特别引入'空镜'类别以处理未捕获动物的触发图像。数据经过MegaDetector预检测、序列去重及分层抽样，形成均衡的1850张图片集合，每类样本量严格控制在200张以内，便于在有限计算资源下完成高效的模型迭代与评估。

解决学术问题

该数据集精准回应了野生动物自动监测领域的核心学术挑战：类别不均衡问题。在自然相机陷阱影像中，常见物种与稀有物种的出现频率悬殊极大，严重制约了深度学习模型的泛化能力。ser_balanced通过严格的每类上限200张和分层采样策略，为研究者提供了一个可复现的基准平台，用于探究小样本条件下的分类性能边界、夜间红外图像（约占56%）的跨模态特征适应，以及序列间独立性假设对模型鲁棒性的影响。其意义在于为生态学中的自动化物种普查提供了方法论基石，推动了计算机视觉技术在保护生物学中的可信应用。

衍生相关工作

ser_balanced衍生了一系列具有深远影响的研究工作。作为Snapshot Safari 2024 Expansion的标准化子集，它直接引用了MegaDetector v1000-redwood的检测结果，为后续的检测-分类级联框架提供了验证数据。在此基础上，研究者开发了面向红外图像的颜色归一化预处理管线，并探索了基于卷积神经网络与轻量级Transformer的物种识别架构对比。数据集的公开许可（CDLA-Permissive）激励了多个迁移学习实验，例如通过ImageNet预训练权重在该平衡子集上微调后，在野生动物场景下取得了超越传统方法的分类准确率。这些工作共同构建了从数据组织到算法创新的完整研究生态，持续推动着生态智能监测技术的边界延伸。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集