five

MMPD|行人检测数据集|多模态数据数据集

收藏
arXiv2024-07-14 更新2024-07-17 收录
行人检测
多模态数据
下载链接:
https://github.com/BubblyYi/MMPedestron
下载链接
链接失效反馈
资源简介:
MMPD数据集是由清华大学、商汤科技研究与Tetras.AI、香港大学和上海人工智能实验室共同创建的大规模多模态行人检测基准。该数据集涵盖了多种传感器模态,包括RGB、红外、深度、激光雷达和事件数据,以及多种模态组合。数据集的创建过程包括整合现有公共数据集和收集新的EventPed数据集,旨在解决复杂场景下行人检测的问题。MMPD数据集的应用领域广泛,包括自动驾驶、机器人和视频监控等,旨在通过多模态数据提高行人检测的准确性和鲁棒性。
提供机构:
清华大学、商汤科技研究与Tetras.AI、香港大学、上海人工智能实验室
创建时间:
2024-07-14
原始信息汇总

MMPedestron 数据集概述

数据集配置和模型

区域提议性能

预训练阶段

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

CrowdHuman

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

COCO-Person

方法与配置 主干网络 下载链接
MMPedestron finetune UNIXViT Google Drive, Baidu Yun (Code: mmpd)

FLIR

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

PEDRo

LLVIP 数据集

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

InOutDoor 数据集

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

STCrowd 数据集

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

EventPed 数据集

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

融合实验

LLVIP

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

InOutDoor

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

STCrowd

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

EventPed

方法与配置 主干网络 下载链接
MMPedestron UNIXViT Google Drive, Baidu Yun (Code: mmpd)

数据准备

请从以下链接获取数据集:MMPD-Dataset

训练与测试

训练

使用 Slurm 管理训练任务:

shell sh tools/slurm_train.sh ${PARTITION} ${JOB_NAME} ${CONFIG_FILE} ${WORK_DIR} ${GPUS}

测试

使用 Slurm 管理测试任务:

shell sh tools/slurm_test.sh ${PARTITION} ${JOB_NAME} ${CONFIG_FILE} ${CHECKPOINT} ${GPUS}

许可证

代码和数据可自由用于非商业用途,并可在这些条件下重新分发。对于商业查询,请联系 Mr. Sheng Jin (jinsheng13[at]foxmail[dot]com)。我们将向您发送详细协议。

引用

如果您发现我们的论文和代码对您的研究有用,请考虑给予星标和引用:

bibtex @inproceedings{zhang2024when, title={When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset}, author={Zhang, Yi and Zeng, Wang and Jin, Sheng and Qian, Chen and Luo, Ping and Liu, Wentao}, booktitle={European Conference on Computer Vision (ECCV)}, year={2024}, month={September} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
MMPD数据集的构建基于现有的公开数据集和名为EventPed的新收集数据集,涵盖了多种传感器模态,包括RGB、IR、Depth、LiDAR和Event数据。通过整合这些数据集,MMPD数据集不仅包含了单一模态的数据,还提供了多种模态组合的数据,如RGB+IR、RGB+Depth、RGB+LiDAR和RGB+Event。此外,MMPD数据集还涵盖了多种应用场景,包括监控、自动驾驶、机器人、户外和室内环境,从而为开发和评估多模态行人检测模型提供了全面的基础。
特点
MMPD数据集的主要特点在于其多模态和多场景的多样性。首先,数据集涵盖了五种不同的传感器模态,每种模态都提供了独特的信息,有助于在复杂环境中进行行人检测。其次,数据集包含了多种模态组合,这使得研究人员可以探索不同模态之间的互补性和协同效应。最后,MMPD数据集的场景多样性确保了模型在不同应用场景中的泛化能力,从而提高了模型的实用性和鲁棒性。
使用方法
MMPD数据集的使用方法主要包括数据预处理、模型训练和性能评估。首先,用户需要对数据进行预处理,包括数据清洗、标注对齐和模态融合。其次,用户可以选择合适的深度学习模型进行训练,利用MMPD数据集的多模态和多场景特性来提升模型的检测性能。最后,通过在MMPD数据集上进行性能评估,用户可以验证模型的有效性和泛化能力,并根据评估结果进行模型的优化和改进。
背景与挑战
背景概述
近年来,随着不同传感器模态(如RGB、IR、深度、LiDAR和事件)在行人检测中的应用,多模态学习逐渐受到研究者的关注。然而,设计一个能够有效处理多种传感器模态的统一通用模型仍然是一个挑战。MMPD数据集由清华大学、商汤科技和香港大学等机构的研究人员于2024年创建,旨在解决多模态行人检测中的统一模型设计问题。该数据集整合了现有的公开数据集和新的EventPed数据集,涵盖了RGB、IR、深度、LiDAR和事件数据等多种传感器模态,为多模态行人检测提供了首个大规模基准。MMPD数据集的构建不仅推动了多模态行人检测技术的发展,还为相关领域的研究提供了丰富的数据资源和评估平台。
当前挑战
MMPD数据集在构建和应用过程中面临多重挑战。首先,现有的行人检测基准主要集中在单一或成对的传感器模态上,缺乏一个能够全面评估多种方法在不同应用场景下的综合基准。其次,以往的多模态融合方法通常针对特定的模态对(如RGB-D或RGB-T)进行设计,难以扩展到其他模态组合。此外,这些方法假设所有模态都可用,未考虑某些模态缺失的情况,加剧了问题的复杂性。最后,不同模态特定的行人数据集来自不同的领域,设计用于特定的应用场景,导致在某一特定模态上训练的行人检测器在不同领域缺乏泛化能力。这些挑战要求研究者在设计多模态行人检测模型时,不仅要考虑模态间的融合,还需增强模型在不同场景和模态组合下的适应性和鲁棒性。
常用场景
经典使用场景
MMPD数据集在多模态行人检测领域中具有经典应用场景,主要用于训练和评估能够处理多种传感器模态(如RGB、IR、Depth、LiDAR和Event)的通用模型。通过结合不同模态的数据,MMPD数据集支持开发能够适应复杂环境和动态条件下的行人检测算法,从而提升检测精度和鲁棒性。
衍生相关工作
MMPD数据集的引入催生了一系列相关研究工作,包括多模态特征融合方法的改进、通用行人检测模型的优化以及跨模态数据集的扩展。例如,基于MMPD数据集的研究已经提出了多种多模态融合策略,如早期融合、中期融合和晚期融合,以及针对特定模态组合的优化模型。这些工作不仅提升了行人检测的性能,还为多模态感知技术的发展提供了新的思路和方法。
数据集最近研究
最新研究方向
在行人检测领域,多模态学习正逐渐成为前沿研究方向。MMPD数据集的引入,标志着多模态行人检测研究进入了一个新的阶段。该数据集不仅整合了现有的公开数据集,还新增了EventPed数据集,涵盖了RGB、IR、Depth、LiDAR和Event等多种传感器模态,为研究者提供了一个全面且多样化的评估平台。MMPedestron模型的提出,进一步推动了多模态行人检测的发展,其能够处理多种模态输入及其动态组合,展示了在复杂场景下的强大适应性和灵活性。这一研究方向不仅提升了行人检测的准确性和鲁棒性,还为自动驾驶、机器人和视频监控等应用领域带来了新的技术突破和应用前景。
相关研究论文
  • 1
    When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset清华大学、商汤科技研究与Tetras.AI、香港大学、上海人工智能实验室 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

FAOSTAT Forestry

FAOSTAT Forestry数据集包含了全球森林资源的相关统计数据,涵盖了森林面积、木材产量、森林管理等多个方面。该数据集提供了详细的国别数据,帮助用户了解全球森林资源的现状和变化趋势。

www.fao.org 收录

光伏电站发电量预估数据

1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。

浙江省数据知识产权登记平台 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录