five

USC-HAD Dataset|人类活动识别数据集|传感器数据数据集

收藏
sipi.usc.edu2024-11-01 收录
人类活动识别
传感器数据
下载链接:
http://sipi.usc.edu/had/
下载链接
链接失效反馈
资源简介:
USC-HAD Dataset是一个用于人类活动识别的数据集,包含27个参与者在不同位置和方向上执行6种基本活动的加速度计和陀螺仪数据。每个参与者执行每个活动5次,每次持续约5秒。数据集包括时间序列数据,每个时间点有3个加速度计和3个陀螺仪的读数。
提供机构:
sipi.usc.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
USC-HAD数据集的构建基于对人体动作的细致分类与标注。该数据集采集了21名参与者在实验室环境中执行的12种不同动作,每种动作重复5次。通过高精度的传感器设备,数据集记录了每个动作的三轴加速度、陀螺仪和磁力计数据,确保了数据的精确性和完整性。数据预处理阶段包括去噪、归一化和时间序列分割,以确保数据质量并便于后续分析。
特点
USC-HAD数据集的显著特点在于其高精度和多样性。数据集涵盖了日常生活中常见的动作,如行走、跳跃和坐下等,为动作识别研究提供了丰富的样本。此外,数据集的标注精细,每个动作的开始和结束时间均被精确记录,便于研究人员进行时间序列分析。数据集的多样性和高质量使其成为动作识别和行为分析领域的宝贵资源。
使用方法
USC-HAD数据集适用于多种机器学习和深度学习模型的训练与验证。研究人员可以利用该数据集进行动作分类、时间序列预测和行为模式识别等任务。数据集的结构化格式和详细标注使得数据处理和模型训练过程相对简便。通过交叉验证和模型评估,研究人员可以有效提升动作识别系统的准确性和鲁棒性。此外,数据集的开源性质也促进了学术界和工业界的广泛应用与合作。
背景与挑战
背景概述
USC-HAD数据集,由南加州大学(University of Southern California, USC)的研究团队于2012年创建,主要用于人体动作识别领域的研究。该数据集包含了27名志愿者在实验室环境中执行的12种不同动作,如行走、跳跃和坐下等,每个动作由9个传感器节点记录。USC-HAD数据集的推出,极大地推动了基于传感器的人体动作识别技术的发展,为研究人员提供了一个标准化的测试平台,促进了相关算法的创新与优化。
当前挑战
尽管USC-HAD数据集在人体动作识别领域具有重要地位,但其构建和应用过程中仍面临若干挑战。首先,数据集的规模相对较小,仅包含27名志愿者的数据,可能不足以覆盖多样化的个体差异。其次,实验室环境下的数据采集限制了其在真实世界中的应用,导致数据集的外部有效性受到质疑。此外,传感器数据的噪声和误差也是一大挑战,需要高效的信号处理和数据清洗技术来确保识别的准确性。
发展历史
创建时间与更新
USC-HAD Dataset由南加州大学(University of Southern California)的研究团队于2012年创建,旨在为人体活动识别(Human Activity Recognition, HAR)领域提供一个标准化的数据集。该数据集在创建后经过多次更新,以确保其数据质量和适用性。
重要里程碑
USC-HAD Dataset的创建标志着人体活动识别领域的一个重要里程碑。该数据集包含了从20名受试者收集的传感器数据,涵盖了7种基本活动和3种静止状态。这一数据集的发布极大地推动了HAR领域的研究进展,为算法开发和性能评估提供了坚实的基础。此外,USC-HAD Dataset的公开发布也促进了学术界和工业界在该领域的合作与交流,成为许多研究论文和应用项目的重要参考数据集。
当前发展情况
当前,USC-HAD Dataset在人体活动识别领域仍然具有重要影响力。随着机器学习和深度学习技术的快速发展,该数据集被广泛用于验证和比较不同算法的性能。研究者们利用USC-HAD Dataset进行模型训练和测试,以提高对人体活动的识别精度。此外,该数据集还被用于开发智能家居、健康监测和运动分析等应用,为相关领域的技术进步和创新提供了有力支持。USC-HAD Dataset的成功应用和持续更新,确保了其在人体活动识别研究中的核心地位。
发展历程
  • USC-HAD Dataset首次发表,由南加州大学(University of Southern California)的研究团队发布,旨在为人体动作识别研究提供一个标准化的数据集。
    2012年
  • 该数据集首次应用于学术研究,多个研究团队开始使用USC-HAD Dataset进行人体动作识别算法的开发和评估。
    2013年
  • 随着深度学习技术的发展,USC-HAD Dataset被广泛用于训练和测试基于深度神经网络的动作识别模型。
    2015年
  • USC-HAD Dataset的扩展版本发布,增加了更多的动作类别和样本,进一步丰富了数据集的内容。
    2018年
  • 该数据集在多个国际会议和期刊上被引用,成为人体动作识别领域的重要基准数据集之一。
    2020年
常用场景
经典使用场景
在人体活动识别领域,USC-HAD Dataset 被广泛用于开发和验证各种机器学习算法。该数据集包含了21名参与者在不同环境下的活动数据,涵盖了7种基本活动,如行走、站立、坐下等。研究者利用此数据集进行特征提取和分类模型的训练,以实现高精度的人体活动识别。
实际应用
在实际应用中,USC-HAD Dataset 为智能家居、健康监测和运动分析等领域提供了技术支持。例如,通过分析用户的活动数据,智能家居系统可以自动调整环境设置,提高用户的生活质量。此外,健康监测设备可以实时跟踪用户的活动状态,及时发现异常情况并提供预警。
衍生相关工作
基于 USC-HAD Dataset,研究者们开发了多种改进的特征提取方法和分类算法。例如,一些研究提出了基于深度学习的活动识别模型,显著提高了识别精度。此外,该数据集还被用于验证多传感器融合技术,进一步提升了系统的鲁棒性和可靠性。这些衍生工作不仅丰富了人体活动识别的理论体系,也为实际应用提供了更多可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

FMA (Free Music Archive)

免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集

OpenDataLab 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录