five

Multiple Cameras Fall Dataset (MCFD)

收藏
github2026-04-18 更新2026-04-22 收录
下载链接:
https://github.com/xiaoran007/B-MCFD
下载链接
链接失效反馈
官方服务:
资源简介:
B-MCFD是Multiple Cameras Fall Dataset (MCFD)的元数据优先版本。它包含了修正后的元数据、明确的对齐语义、可重现的默认清单以及一小部分脚本,用于将原始视频转换为研究就绪的派生资产。

B-MCFD is a metadata-first iteration of the Multiple Cameras Fall Dataset (MCFD). It includes corrected metadata, explicit alignment semantics, reproducible default manifests, and a small set of scripts for converting raw videos into research-ready derived assets.
创建时间:
2026-04-17
原始信息汇总

B-MCFD 数据集概述

数据集简介

B-MCFD 是针对多摄像头跌倒数据集(MCFD)的一个以元数据为先的版本。它提供了修正后的元数据、明确的校准语义、可复现的默认清单文件,以及一组用于将原始视频转换为可用于研究的衍生资产的小型脚本。

数据集背景

原始 MCFD 技术报告发布于 2010 年,但其部分官方元数据存在错误。2025 年发布的后续修正解决了一些问题,但在将报告内容转化为代码时,某些表格的解释仍存在模糊之处。这导致了三个实际问题:印刷的元数据无法直接被机器读取;修正后的值分散在报告和勘误来源中;下游用户很容易在延迟、参考摄像头、片段边界和标签方面做出不一致的选择。B-MCFD 通过提供程序友好的元数据发布、明确的语义、来源说明以及用于常见数据准备任务的轻量级脚本来弥补这一差距。

数据集内容

  • 修正的元数据:位于 data/metadata 目录下。
  • 默认校准清单:位于 data/manifests/aligned_manifest_clip16_stride4.csv
  • 独立脚本:位于 scripts 目录下。
  • 实现代码:位于 src/b_mcfd 目录下。
  • 文档:位于 docs 目录下。

原始数据集

原始 MCFD 数据集可从 https://www.iro.umontreal.ca/~labimage/Dataset/ 下载。预期的原始布局结构如下:

dataset ├── chute01 │   ├── cam1.avi │   ├── cam2.avi │   ├── cam3.avi │   ├── cam4.avi │   ├── cam5.avi │   ├── cam6.avi │   ├── cam7.avi │   └── cam8.avi ├── chute02 │   ├── cam1.avi │   ├── cam2.avi │   ├── cam3.avi │   ├── cam4.avi │   ├── cam5.avi │   ├── cam6.avi │   ├── cam7.avi │   └── cam8.avi ...

核心依赖

该仓库设计为轻量级。不同任务需要不同的依赖项。

任务 所需依赖 备注
读取已提供的元数据和清单文件 仅需文本编辑器或 CSV/JSON 工具 仓库已包含修正后的元数据和默认清单。
运行 scripts/build_manifest.py Python 3.9+、torchtorchcodec 用于视频探测、帧计数和有效性检查。
运行 scripts/export_segments.py Python 3.9+、opencv-python 片段导出使用 OpenCV 进行探测和写入,避免在单个进程中混合使用 FFmpeg 运行时。
运行 scripts/build_cache.py Python 3.9+、torchtorchcodec 根据清单构建可选的 .pt 剪辑缓存。

请注意,torchcodec 要求系统已安装 FFmpeg

元数据目录

data/metadata 目录包含该仓库机器可读的核心内容。

  • segments_corrected.csv:在校准后的参考时间线上的修正片段标注。
  • camera_delay_corrected.csv:修正后的每个场景、每个摄像头的帧延迟。
  • camera_calibration_report.json:从技术报告中转录的摄像头校准值。
  • splits_scenario_fixed.json:为方便基准测试提供的默认场景划分。
  • PROVENANCE.md:解释每个元数据文件来源的说明。

更多细节请参阅:https://github.com/xiaoran007/B-MCFD/blob/main/docs/metadata-semantics.md

脚本与典型用法

从仓库根目录运行脚本。

1. 构建校准清单

当需要在共享的校准时间线上采样剪辑中心时使用此脚本。 bash python scripts/build_manifest.py --dataset-root /path/to/MCFD/dataset --output data/manifests/aligned_manifest_clip16_stride4.csv --clip-len 16 --stride 4 --path-mode relative

已提供的默认清单使用 clip_len=16stride=4 以及相对路径(如 chute01/cam1.avi)。

更多细节请参阅:https://github.com/xiaoran007/B-MCFD/blob/main/docs/manifest-schema.md

2. 导出实际修剪后的片段视频

当需要将原始流中标注值对应的部分导出为实际视频文件时使用此脚本。 bash python scripts/export_segments.py --dataset-root /path/to/MCFD/dataset --output-dir artifacts/segments

可选场景过滤: bash python scripts/export_segments.py --dataset-root /path/to/MCFD/dataset --output-dir artifacts/segments --scenario-ids 1,2,3

导出过程会为每个场景、片段和摄像头生成一个修剪后的视频,同时附带 JSON 元数据旁文件和汇总 CSV 文件。

更多细节请参阅:https://github.com/xiaoran007/B-MCFD/blob/main/docs/segment-export.md

3. 构建可选的剪辑缓存

当需要为下游实验预解码张量时使用此脚本。 bash python scripts/build_cache.py --manifest data/manifests/aligned_manifest_clip16_stride4.csv --dataset-root /path/to/MCFD/dataset --cache-root artifacts/cache --clip-len 16 --workers 1

缓存步骤是可选的。许多工作流仅需要元数据文件或校准清单。但如果希望将该数据集集成到深度学习流水线中(例如 i3d),构建预解码剪辑的缓存可以节省时间并减少 I/O 开销。

对于使用现代 pytorch 的现代 GPU,可以使用 https://github.com/xiaoran007/Kinetics-i3d-for-modern-pytorch 以便于集成。

重要说明

  • 预期的原始数据集布局是 chuteXX/camY.avi
  • position_code 是该仓库保留的主要报告标签。
  • binary_fall_label = int(position_code in {2, 3}) 是为二元任务提供的便利标签。
  • 如果替换了 splits_scenario_fixed.json,需要重建任何依赖于它的衍生清单或缓存文件。

致谢与引用

B-MCFD 基于 Auvinet 及其合作者发布的原始 MCFD 数据集构建。如果在学术工作中使用此仓库,请引用原始数据集报告:

Auvinet, Edouard, Caroline Rougier, Jean Meunier, Alain St-Arnaud, and Jacqueline Rousseau. "Multiple cameras fall dataset." DIRO-Université de Montréal, Tech. Rep 1350 (2010): 24.

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与行为分析领域,多视角视频数据集对于研究人体姿态与异常行为检测至关重要。Multiple Cameras Fall Dataset (MCFD) 最初于2010年发布,其构建基于多个同步摄像头捕捉的模拟跌倒场景视频。原始数据集包含多个场景(如chute01、chute02等),每个场景下部署了八台摄像机,从不同角度录制AVI格式视频,以覆盖复杂环境下的视觉信息。然而,原始元数据存在误差,导致后续使用中面临对齐与标注的不一致问题。为此,B-MCFD项目在2025年提供了修正版本,通过程序友好的元数据文件(如segments_corrected.csv和camera_delay_corrected.csv)重新校准时间线与摄像机延迟,确保数据在机器可读的基础上具备高精度语义对齐。
特点
MCFD数据集的核心特点在于其多视角同步采集与精细的元数据标注。数据集涵盖多个模拟跌倒场景,每场景配备八台摄像机,提供了丰富的空间视角信息,有助于研究视角不变性与行为识别。修正后的元数据解决了原始报告中的错误,包括时间延迟校准和分段边界明确化,使得数据对齐更加可靠。此外,数据集引入了二进制跌倒标签(binary_fall_label),基于位置代码(position_code)自动生成,简化了分类任务的预处理。B-MCFD还提供了默认对齐清单(aligned_manifest_clip16_stride4.csv)和轻量脚本,支持快速生成研究就绪的衍生资产,增强了数据集的可用性与可重复性。
使用方法
使用MCFD数据集时,研究人员可依据B-MCFD提供的工具链高效处理数据。首先,通过下载原始视频并按指定布局组织,随后利用脚本构建对齐清单,例如使用build_manifest.py以指定剪辑长度和步长生成CSV文件,便于视频片段采样。对于具体分析任务,export_segments.py可将标注片段导出为修剪后的视频文件,并附带元数据JSON和摘要CSV。若需深度学习集成,build_cache.py可将视频剪辑预解码为张量缓存,减少I/O开销,方便与如I3D等模型结合。整个过程依赖Python环境及OpenCV、Torch等库,但元数据文件可直接查看,无需运行代码,确保了灵活的工作流适配。
背景与挑战
背景概述
多相机跌倒数据集(MCFD)由Auvinet等研究人员于2010年发布,隶属于蒙特利尔大学DIRO实验室。该数据集旨在通过多视角视频监控技术,解决老年人跌倒检测这一关键公共卫生问题。其核心研究聚焦于利用多个同步相机捕捉模拟跌倒场景,以促进计算机视觉算法在行为识别与异常事件监测领域的进展。MCFD为跌倒检测研究提供了宝贵的多视角时序数据,推动了基于视觉的监控系统在健康护理中的应用,成为该领域早期的重要基准之一。
当前挑战
MCFD所针对的跌倒检测任务面临诸多挑战:多相机视角下的时空对齐、复杂环境中的遮挡处理、以及跌倒行为与日常活动的细微区分均对算法鲁棒性提出较高要求。在数据集构建过程中,原始元数据存在错误与模糊性,导致机器可读性不足,且修正信息分散于报告与勘误中,使得下游用户在延迟校准、参考相机选择、片段边界与标签解释上易产生不一致性,影响了数据复现与实验可比性。
常用场景
经典使用场景
在计算机视觉与行为分析领域,多摄像头跌倒数据集(MCFD)为跌倒检测算法的开发与评估提供了关键基准。该数据集通过八个同步摄像头捕捉不同场景下的跌倒动作,其经典应用场景集中于训练和验证基于视频的跌倒识别模型。研究者利用多视角视频序列,能够深入分析人体姿态的动态变化,从而提升模型在复杂环境下的鲁棒性与泛化能力。
实际应用
在实际应用层面,MCFD支撑了智能监控与健康护理系统的开发。基于该数据集训练的模型可集成于养老院、医院等场所的安防系统中,实现自动跌倒报警与紧急响应。多摄像头布局模拟了真实监控环境,使得算法能够克服遮挡、光照变化等挑战,提升监测的准确性与时效性,为保障老年人独立生活安全提供了技术保障。
衍生相关工作
围绕MCFD衍生了一系列经典研究工作,主要集中在多视角行为识别、时序动作分割与深度学习模型优化等领域。例如,研究者利用该数据集开发了基于I3D等三维卷积网络的跌倒检测框架,并探索了跨摄像头特征融合策略。这些工作不仅拓展了多源视觉信息处理的学术边界,也为后续大规模公共行为数据集的构建提供了重要参考范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作