gauravkaul/DAMM_mouse_detection
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/gauravkaul/DAMM_mouse_detection
下载链接
链接失效反馈官方服务:
资源简介:
DAMM项目的数据集用于在复杂的社会和环境设置中检测和跟踪多个动物,目标是创建能够跨笼子和实验设置泛化的小鼠实例分割系统。数据集分为检测数据集和跟踪数据集,分别存储在`detection_datasets/`和`tracking_datasets/`目录中。检测数据集包括AER预训练数据集、AER实验室来源数据集、网络来源数据集和挑战数据集,每个数据集都有详细的示例数量和文件夹位置。跟踪数据集包括单动物和多动物数据集,每个数据集都有标注的帧数、帧率和持续时间。数据集的标注结构采用与COCO风格兼容的JSON格式,包含图像文件名、高度、宽度、图像ID和标注列表等信息。
DAMM项目的数据集用于在复杂的社会和环境设置中检测和跟踪多个动物,目标是创建能够跨笼子和实验设置泛化的小鼠实例分割系统。数据集分为检测数据集和跟踪数据集,分别存储在`detection_datasets/`和`tracking_datasets/`目录中。检测数据集包括AER预训练数据集、AER实验室来源数据集、网络来源数据集和挑战数据集,每个数据集都有详细的示例数量和文件夹位置。跟踪数据集包括单动物和多动物数据集,每个数据集都有标注的帧数、帧率和持续时间。数据集的标注结构采用与COCO风格兼容的JSON格式,包含图像文件名、高度、宽度、图像ID和标注列表等信息。
提供机构:
gauravkaul
原始信息汇总
数据集概述
数据集用途
DAMM项目专注于在复杂的社会和环境设置中检测和跟踪多个动物,旨在创建适用于不同笼子和实验设置的鼠标实例分割系统。
注释结构
- 格式:使用与COCO兼容的JSON格式。
- 包含字段:
file_name: 图像文件名,包括路径。height: 图像高度(像素)。width: 图像宽度(像素)。image_id: 图像标识符。annotations: 包含以下字段:bbox: 对象边界框,格式为[[x1, y1], [x2, y2]]。bbox_mode: 边界框坐标格式,为BoxMode.XYXY_ABS。category_id: 对象类别标识符。segmentation: 对象掩码,表示为闭合多边形区域。
检测数据集
- 存储位置:
detection_datasets/目录。 - 数据集列表:
- AER Pretraining Dataset
AER pretraining: 2209个样本,位于AER_pretraining_set/。
- AER Lab Sourced (In-house) Datasets
playground: 103个样本,位于playground/。light_dark_nest: 104个样本,位于light_dark_nest/。perfect_setup: 102个样本,位于perfect_setup/。colorful_multi_mice: 102个样本,位于colorful_multi_mice/。black_multi_mice: 101个样本,位于black_multi_mice/。
- Web Sourced (Publicly Available) Datasets
golden_open_field: 101个样本,位于golden_open_field/。mars_multi: 104个样本,位于mars_multi/。mcdannald_rat_operant_chamber: 106个样本,位于mcdannald_rat_operant_chamber/。trimice_dlc: 101个样本,位于trimice_dlc/。pennington_maze: 102个样本,位于pennington_maze/。golden_home_cage_color: 100个样本,位于golden_home_cage_color/。golden_home_cage_greyscale: 101个样本,位于golden_home_cage_greyscale/。
- Challenge Datasets
- 多个数据集,样本数量从71到100不等,位于
challenge_setups/下的各个子目录。
- 多个数据集,样本数量从71到100不等,位于
- AER Pretraining Dataset
跟踪数据集
- 存储位置:
tracking_datasets/目录。 - 数据集列表:
- Single Animal Datasets
- 多个数据集,帧数从145到2410不等,位于
single_animal_tracking/下的各个子目录。
- 多个数据集,帧数从145到2410不等,位于
- Multi-Animal Datasets
- 多个数据集,帧数从174到1965不等,位于
multi_animal_tracking/下的各个子目录。
- 多个数据集,帧数从174到1965不等,位于
- Single Animal Datasets
搜集汇总
数据集介绍

构建方式
在行为神经科学研究中,精确的动物检测与追踪是解析复杂社会互动的关键。DAMM_mouse_detection数据集的构建采用了系统化的数据整合策略,汇集了来自实验室内部采集与公开网络资源的多样化视频数据。该数据集通过严格的标注流程,以COCO风格的JSON格式统一组织,涵盖了边界框与实例分割的多层次注释信息,确保了标注的一致性与机器可读性。
特点
该数据集的核心特征在于其广泛的场景覆盖与丰富的实验条件。它不仅包含了常规的开放场地与家庭笼环境,还引入了具有挑战性的多动物互动、不同光照条件及多种拍摄设备下的视频序列。这种多样性显著提升了模型在复杂环境中的泛化能力,为开发鲁棒的动物行为分析算法提供了坚实的数据基础。
使用方法
研究人员可通过解压提供的压缩文件访问检测与追踪两个独立的数据子集。每个子集均包含结构化的元数据文件,便于直接加载至主流计算机视觉框架进行模型训练与评估。该数据集特别适用于训练和验证面向多动物实例分割与跨场景追踪的深度学习模型,推动行为自动化分析技术的发展。
背景与挑战
背景概述
在行为神经科学领域,对实验动物进行精确的检测与追踪是解析复杂社会行为与环境互动的关键。DAMM(Detect Any Mouse Model)数据集由Gaurav Kaul等研究人员于2024年构建,旨在开发能够泛化于不同笼具和实验设置的小鼠实例分割系统。该数据集整合了实验室内部采集与公开来源的多模态视频数据,涵盖了从开放场地到操作箱等多种环境,其核心研究问题聚焦于提升多动物场景下检测模型的鲁棒性与泛化能力,为自动化行为分析提供了重要的数据基础。
当前挑战
该数据集致力于解决复杂社会与环境设置下多动物检测与追踪的领域挑战,包括动物间遮挡、外观相似性以及动态背景干扰等问题。在构建过程中,研究人员面临数据异质性挑战,需整合来自不同相机型号、照明条件和拍摄角度的多样化视频源,并确保COCO格式标注在实例分割任务中的一致性与精确性。此外,数据规模的有限性以及标注过程对专业知识的依赖,亦对模型的泛化性能提出了更高要求。
常用场景
经典使用场景
在行为神经科学领域,动物行为分析是理解认知与社会互动的基石。DAMM_mouse_detection数据集通过整合多样化的实验场景,如开放场地、家庭笼舍及操作箱环境,为小鼠实例分割模型的训练与评估提供了标准化基准。该数据集支持从静态图像到动态视频的多模态分析,典型应用包括在复杂光照与背景干扰下,精准识别并分割多只小鼠的轮廓,从而为量化动物姿态、位置及群体动态奠定数据基础。
解决学术问题
该数据集致力于解决行为研究中长期存在的技术瓶颈,即如何在多变实验设置下实现鲁棒且泛化性强的动物检测。通过融合实验室自采集与公开来源的多样化数据,它有效应对了因环境异质性、动物外观变异及遮挡现象导致的识别误差问题。其意义在于推动了计算机视觉与行为科学的交叉融合,为自动化行为分析提供了可复现的评估框架,显著提升了实验数据的客观性与可比性。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在泛化性实例分割架构与多目标跟踪算法的创新上。例如,基于DAMM数据训练的检测模型被扩展用于跨物种行为分析,如大鼠或果蝇的轨迹追踪;同时,其标注框架启发了后续研究构建统一的行为分析管道,将检测、分割与行为分类任务集成,推动了如Social Behavior Atlas等工具的发展,进一步深化了动物社会行为计算的自动化水平。
以上内容由遇见数据集搜集并总结生成



