MMPedestron Benchmark Dataset

github2024-07-15 更新2024-07-16 收录

下载链接：

https://github.com/BubblyYi/MMPedestron

下载链接

链接失效反馈

官方服务：

资源简介：

MMPedestron Benchmark Dataset是一个多模态学习下的行人检测数据集，包含CrowdHuman, COCO-Person, FLIR, PEDRo等多个子数据集。

MMPedestron基准数据集（MMPedestron Benchmark Dataset）是面向多模态学习的行人检测基准数据集，涵盖CrowdHuman、COCO-Person、FLIR、PEDRo等多个子数据集。

创建时间：

2024-07-07

原始信息汇总

MMPedestron 数据集概述

数据集简介

MMPedestron 是一个用于行人检测的多模态学习数据集，由以下作者共同开发：

Yi Zhang
Wang ZENG
Sheng Jin
Chen Qian
Ping Luo
Wentao Liu

数据集配置和模型

数据集包含多个子集和相应的模型配置，具体如下：

区域提议性能

预训练阶段
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
CrowdHuman
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
COCO-Person
- 方法&配置: MMPedestron finetune
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
FLIR
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
PEDRo
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
LLVIP Datasets
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
InOutDoor Datasets
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
STCrowd Datasets
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)
EventPed Datasets
- 方法&配置: MMPedestron
- 骨干网络: UNIXViT
- 下载链接: Google Drive, Baidu Yun (Code: mmpd)

数据集获取

请从以下链接获取数据集：MMPD-Dataset

许可证

代码和数据可自由用于非商业用途，商业查询请联系 Sheng Jin (jinsheng13[at]foxmail[dot]com)。

引用

如果您在研究中使用了我们的论文和代码，请考虑给予引用。

bibtex @inproceedings{zhang2024when, title={When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset}, author={Zhang, Yi and Zeng, Wang and Jin, Sheng and Qian, Chen and Luo, Ping and Liu, Wentao}, booktitle={European Conference on Computer Vision (ECCV)}, year={2024}, month={September} }

搜集汇总

数据集介绍

构建方式

MMPedestron Benchmark Dataset的构建基于多模态学习方法，整合了多种数据源，包括RGB图像、红外图像、深度图像、激光雷达数据等。数据集的构建过程涉及对多个公开数据集的预处理和融合，如CrowdHuman、COCO-Person、FLIR、PEDRo、LLVIP、InOutDoor、STCrowd和EventPed等。通过这种方式，数据集不仅涵盖了不同场景下的行人检测需求，还提供了丰富的多模态数据，以支持多模态学习模型的训练和评估。

特点

MMPedestron Benchmark Dataset的显著特点在于其多模态数据的丰富性和多样性。数据集不仅包含了传统的RGB图像，还引入了红外图像、深度图像、激光雷达数据等多种模态，使得模型能够在不同光照条件、天气条件和视角下进行有效的行人检测。此外，数据集还提供了详细的标注信息，包括行人的边界框和类别标签，便于研究人员进行精确的模型训练和性能评估。

使用方法

使用MMPedestron Benchmark Dataset进行研究时，首先需要下载数据集并进行预处理，以确保数据格式与模型输入要求一致。随后，研究人员可以根据具体需求选择合适的模型配置文件，并利用提供的训练脚本进行模型训练。数据集支持多种深度学习框架，如PyTorch和TensorFlow，研究人员可以根据自己的偏好选择合适的框架。在模型训练完成后，可以使用测试脚本对模型进行评估，并根据评估结果进行进一步的优化和调整。

背景与挑战

背景概述

MMPedestron Benchmark Dataset是由Yi Zhang、Wang ZENG、Sheng Jin、Chen Qian、Ping Luo和Wentao Liu等研究人员在2024年创建的，旨在解决行人检测与多模态学习结合的核心研究问题。该数据集的构建基于ECCV2024会议上的论文《When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset》，标志着行人检测领域在多模态数据融合方面的重要进展。通过整合多种数据源，如RGB图像、红外图像、深度信息等，MMPedestron Benchmark Dataset为行人检测算法提供了丰富的训练和测试资源，极大地推动了该领域的发展。

当前挑战

MMPedestron Benchmark Dataset在构建过程中面临多重挑战。首先，数据的多模态特性要求算法能够有效融合不同类型的数据，以提高检测精度。其次，不同数据源之间的差异性，如光照条件、视角变化等，增加了数据预处理的复杂性。此外，数据集的规模和多样性也对存储和计算资源提出了高要求。在应用层面，如何利用该数据集开发出高效且鲁棒的行人检测模型，以应对实际场景中的各种复杂情况，是当前研究的主要挑战。

常用场景

经典使用场景

在多模态行人检测领域，MMPedestron Benchmark Dataset 被广泛用于训练和评估多模态行人检测模型。该数据集结合了多种传感器数据，如RGB图像、红外图像、深度图像等，使得模型能够在不同光照条件和环境背景下准确检测行人。经典的使用场景包括在自动驾驶系统中，通过融合多种传感器数据来提高行人检测的准确性和鲁棒性，从而增强车辆的安全性能。

衍生相关工作

基于 MMPedestron Benchmark Dataset，研究者们开发了多种多模态行人检测模型，如基于深度学习的融合网络、跨模态特征提取算法等。这些工作不仅提升了行人检测的准确性，还推动了多模态学习在计算机视觉领域的应用。此外，该数据集还激发了其他相关研究，如多模态数据融合策略、跨模态特征对齐方法等，进一步丰富了多模态学习的理论和实践。

数据集最近研究