mmDoppler|毫米波雷达数据集|人体活动识别数据集

arXiv2024-07-31 更新2024-08-02 收录

毫米波雷达

人体活动识别

下载链接：

https://github.com/arghasen10/mmdoppler

下载链接

链接失效反馈

资源简介：

mmDoppler数据集由印度理工学院卡拉格普尔分校创建，专注于通过商用毫米波雷达捕捉多强度连续人体活动。数据集包含75000条记录，涵盖19种日常活动，包括宏活动和微活动。数据集通过调整雷达的多普勒分辨率，精确捕捉从大动作到细微动作的各种活动。该数据集旨在通过提供详细的范围-多普勒热图，增强毫米波雷达在人体活动识别中的鲁棒性和准确性，适用于健康监测、老年护理和安全等多个领域。

提供机构：

印度理工学院卡拉格普尔分校

创建时间：

2024-07-31

原始信息汇总

mmDoppler 数据集概述

数据集简介

mmDoppler 是一个使用商用毫米波雷达捕捉宏观和微观人类活动的新型数据集。该数据集包含七名受试者执行的19种不同活动，并采用自适应多普勒分辨率来增强活动识别。通过根据活动类型调整雷达的多普勒分辨率，系统能更精确地捕捉细微运动。mmDoppler 包括距离-多普勒热图，提供详细的动态运动数据，数据在受控环境中收集，支持单人和多人同时进行活动。

数据集特征

特征	描述
datetime	数据记录的日期和时间，有助于时间序列分析和与其他数据源同步。
rangeIdx	对应检测对象的距离仓索引，表示对象与雷达的距离。
dopplerIdx	对应多普勒仓的索引，表示检测对象的相对速度。
numDetectedObj	单帧中检测到的对象数量，有助于理解多用户活动的场景动态。
range	检测对象与雷达的实际距离测量值，单位为米。
peakVal	检测信号的峰值，表示返回雷达信号的强度。
x_coord	雷达坐标系中检测对象的x坐标。
y_coord	雷达坐标系中检测对象的y坐标。
doppz	距离-多普勒热图值，表示检测对象的径向速度，有助于区分静止和移动对象。
Position	受试者相对于雷达的位置，如2m、3m和5m。
Orientation	受试者相对于雷达轴向角的方向：左、右、前、后。
activity	受试者执行的具体活动，如行走、跑步或打字，用于机器学习和分类任务。
activity_class	活动的广义分类标签，区分宏观活动或微观活动。

数据集重要性

数据集	模态	活动类型	# 类别	粒度	# 帧	有效持续时间 (s)	多用户
mmDoppler	mmWave pointcloud, Range-Doppler heatmaps	日常活动, 运动	19	宏观和微观	75k	23100	是

AI搜集汇总

数据集介绍

构建方式

mmDoppler数据集通过使用商用毫米波雷达（COTS mmWave radar）来捕捉宏微观尺度的人类活动。该数据集包括七名受试者执行的19种不同活动，并采用自适应多普勒分辨率来增强活动识别。通过根据活动类型调整雷达的多普勒分辨率，系统能够更精确地捕捉细微的运动。数据集包括范围-多普勒热图，提供了详细的动态运动数据，这些数据在受控环境中收集，包括单人和多人同时执行活动的情况。

特点

mmDoppler数据集的主要特点包括：1）范围-多普勒信息：与仅包含点云的传统活动数据集不同，mmDoppler特别包含了不同日常活动的范围-多普勒热图。2）自适应多普勒分辨率：通过动态调整雷达的灵敏度，更好地捕捉宏微观尺度的活动。3）多样化的活动集：包括19种不同的活动类别，涵盖日常生活中的宏微观活动。4）真实世界设置：数据收集模拟了室内环境的多样化场景，增强了数据集在真实世界中的适用性。5）受控环境：数据收集在受控的室内环境中进行，确保了数据的质量和一致性。6）多受试者：数据集独特地包括多个受试者同时执行各种活动，反映了真实世界中多人互动的复杂性和变异性。

使用方法

mmDoppler数据集为研究人员和开发者提供了一个宝贵的资源，用于开发和评估基于连续被动感知的人类活动识别系统。使用该数据集时，研究人员可以利用范围-多普勒热图和点云数据，结合自适应多普勒分辨率，来训练和测试他们的模型。数据集的多样性和丰富性使其适用于各种机器学习和深度学习算法，特别是那些需要高分辨率运动数据的应用。通过公开该数据集，我们希望促进毫米波雷达技术在人类活动识别领域的进一步研究和创新。

背景与挑战

背景概述

mmDoppler数据集由印度IIT Kharagpur和NIIT University的研究人员于2024年创建，旨在解决多强度连续人体活动识别的问题。该数据集利用商用毫米波雷达（COTS mmWave radar）捕捉宏微观尺度的人体运动，通过机器学习驱动的信号处理管道，提供了一种新颖的活动识别方法。主要研究人员包括Argha Sen、Anirban Das、Swadhin Pradhan和Sandip Chakraborty。该数据集的核心研究问题是如何在被动传感环境中准确识别和区分宏微观尺度的人体活动，这对于医疗保健、老年护理、安全和人机交互等领域具有重要意义。mmDoppler数据集的发布填补了现有活动识别系统在宏微观尺度活动识别上的空白，为提升毫米波雷达活动识别的鲁棒性和准确性提供了宝贵的资源。

当前挑战

mmDoppler数据集在构建过程中面临多项挑战。首先，毫米波雷达在捕捉微观尺度活动（如打字）时存在困难，因为这些活动涉及的微小运动难以被传统毫米波雷达捕捉。其次，数据集的构建需要适应不同的多普勒分辨率，以确保既能捕捉宏观活动（如运动），又能捕捉微观活动（如细微的手部动作）。此外，数据集的收集需要在受控环境中进行，以避免不可预测的噪声信号，同时确保数据的多样性和真实性。最后，多用户同时进行活动的情况增加了数据处理的复杂性，需要开发新的方法来区分和识别不同用户的活动。这些挑战共同推动了mmDoppler数据集的创新和完善，使其成为活动识别领域的重要资源。

常用场景

经典使用场景

mmDoppler数据集的经典使用场景在于通过商用毫米波雷达（COTS mmWave radar）捕捉日常生活中的宏微观人类活动。该数据集通过调整雷达的多普勒分辨率，精确捕捉从细微的手指动作到大幅度的手势变化。这种灵活性使得mmDoppler成为研究人类活动识别（HAR）系统的理想选择，特别是在需要同时识别宏观和微观活动的应用中。

实际应用

mmDoppler数据集在多个实际应用场景中具有重要价值，包括但不限于健康监测、老年人护理、安全和人机交互。例如，在健康监测中，该数据集可以帮助识别老年人的日常活动模式，及时发现异常行为；在安全领域，它可以用于监控公共场所的活动，提高安全防范能力；在人机交互中，它可以用于开发更自然、更直观的交互方式。

衍生相关工作

mmDoppler数据集的发布催生了一系列相关研究工作，特别是在毫米波雷达和人类活动识别领域。例如，一些研究利用mmDoppler数据集开发了新的机器学习模型，以提高活动识别的准确性；另一些研究则探索了如何将毫米波雷达与其他传感器（如摄像头和惯性测量单元）结合，以实现更全面的活动监测。此外，mmDoppler还激发了对多用户环境下活动识别的研究，推动了这一领域的技术进步。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集，旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段，涵盖超过70种不同的复杂背景，确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向，通过收集大量真实场景下的手语视频材料，覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域，旨在提高手语识别技术在复杂环境中的准确性和效率，促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库，由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音，录音在安静的室内环境中使用高保真麦克风进行，并下采样至16kHz。通过专业的语音标注和严格的质量检查，手动转录的准确率超过95%。该数据集免费供学术使用，旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

Figshare

Figshare是一个在线数据共享平台，允许研究人员上传和共享各种类型的研究成果，包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性，12位男性)，以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情，歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常，强烈) 下产生的，另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位，48kHz .wav)，音频-视频 (720p H.264，AAC 48kHz，.mp4) 和仅视频 (无声音)。注意，Actor_18没有歌曲文件。

OpenDataLab 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库，旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合，以增加开放源代码声纳数据集的可见性，并提供一个更容易查找和比较数据集的方式。

github 收录