mmDoppler|毫米波雷达数据集|人体活动识别数据集
收藏mmDoppler 数据集概述
数据集简介
mmDoppler 是一个使用商用毫米波雷达捕捉宏观和微观人类活动的新型数据集。该数据集包含七名受试者执行的19种不同活动,并采用自适应多普勒分辨率来增强活动识别。通过根据活动类型调整雷达的多普勒分辨率,系统能更精确地捕捉细微运动。mmDoppler 包括距离-多普勒热图,提供详细的动态运动数据,数据在受控环境中收集,支持单人和多人同时进行活动。
数据集特征
特征 | 描述 |
---|---|
datetime | 数据记录的日期和时间,有助于时间序列分析和与其他数据源同步。 |
rangeIdx | 对应检测对象的距离仓索引,表示对象与雷达的距离。 |
dopplerIdx | 对应多普勒仓的索引,表示检测对象的相对速度。 |
numDetectedObj | 单帧中检测到的对象数量,有助于理解多用户活动的场景动态。 |
range | 检测对象与雷达的实际距离测量值,单位为米。 |
peakVal | 检测信号的峰值,表示返回雷达信号的强度。 |
x_coord | 雷达坐标系中检测对象的x坐标。 |
y_coord | 雷达坐标系中检测对象的y坐标。 |
doppz | 距离-多普勒热图值,表示检测对象的径向速度,有助于区分静止和移动对象。 |
Position | 受试者相对于雷达的位置,如2m、3m和5m。 |
Orientation | 受试者相对于雷达轴向角的方向:左、右、前、后。 |
activity | 受试者执行的具体活动,如行走、跑步或打字,用于机器学习和分类任务。 |
activity_class | 活动的广义分类标签,区分宏观活动或微观活动。 |
数据集重要性
数据集 | 模态 | 活动类型 | # 类别 | 粒度 | # 帧 | 有效持续时间 (s) | 多用户 |
---|---|---|---|---|---|---|---|
mmDoppler | mmWave pointcloud, Range-Doppler heatmaps | 日常活动, 运动 | 19 | 宏观和微观 | 75k | 23100 | 是 |
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录