five

SisFallDataset|跌倒检测数据集|人体动作识别数据集

收藏
github2024-04-08 更新2024-05-31 收录
跌倒检测
人体动作识别
下载链接:
https://github.com/JiayangLai/SisFallDatasetAnnotation
下载链接
链接失效反馈
资源简介:
SisFall是一个优秀的开放数据集,用于监督学习,原始格式为.txt,需要转换为.csv并进行标注。

SisFall is an excellent open dataset designed for supervised learning. The original format is .txt, which needs to be converted to .csv and annotated.
创建时间:
2019-05-13
原始信息汇总

数据集概述

数据集名称

  • SisFallDatasetAnnotation

数据集描述

  • SisFall 是一个开放的数据集,主要用于监督学习。

数据集格式

  • 原始格式为 .txt
  • 目标格式为 .csv

数据集标注

  • 数据集目前无标注,需要进行标注转换。

标注类别

  • 行走:标签 1
  • 慢跑:标签 2
  • 上楼:标签 5
  • 下楼:标签 6

处理步骤

  1. .txt 格式转换为 .csv 格式。
  2. 对转换后的数据进行标注。
AI搜集汇总
数据集介绍
main_image_url
构建方式
SisFallDataset的构建方式主要通过将原始的.txt文件转换为.csv格式,并进行详细的标注。这一过程首先涉及数据格式的转换,随后根据不同的活动类型进行分类标注,如步行、慢跑、上楼和下楼等,分别赋予相应的标签。这种构建方式确保了数据集在监督学习中的可用性,并为后续的分析和模型训练提供了结构化的数据基础。
特点
SisFallDataset的主要特点在于其开放性和多样性。该数据集包含了多种日常活动,如步行、慢跑、上下楼梯等,每种活动都被赋予了特定的标签,便于分类和识别。此外,数据集的原始格式为.txt,经过转换和标注后,形成了易于处理的.csv格式,这不仅提高了数据的可读性,也增强了其在机器学习任务中的适用性。
使用方法
使用SisFallDataset时,用户首先需要下载并解压数据集,随后可以利用数据处理工具将.csv文件导入到分析环境中。数据集中的每条记录都包含了活动的详细信息和对应的标签,用户可以根据这些信息进行监督学习模型的训练。此外,数据集的多样性使其适用于多种机器学习任务,如活动识别和行为分析,用户可以根据具体需求选择合适的模型和算法进行应用。
背景与挑战
背景概述
SisFallDataset是由Sistemic研究团队在Universidad de Antioquia开发的一个公开数据集,专注于人体跌倒行为的监测与分析。该数据集的创建旨在为监督学习提供丰富的数据资源,特别是在缺乏标注的情况下,为研究者提供了一个挑战性的平台。SisFallDataset的核心研究问题围绕如何通过传感器数据准确识别和分类不同的运动行为,如步行、慢跑、上楼和下楼等。这一研究不仅在健康监测领域具有重要意义,也为智能穿戴设备的发展提供了宝贵的数据支持。
当前挑战
SisFallDataset的主要挑战在于其原始数据缺乏标注,这为监督学习带来了显著的困难。此外,数据格式为.txt文件,需要转换为更易于处理的.csv格式,这一过程增加了数据预处理的复杂性。在标注过程中,如何准确区分不同类型的步行和慢跑行为,以及上楼和下楼的动作,也是一项技术挑战。这些挑战不仅涉及数据处理的技术细节,还要求研究者在运动行为分类的准确性和效率之间找到平衡。
常用场景
经典使用场景
SisFallDataset 主要用于人体跌倒检测的研究领域,尤其是在基于加速度传感器数据的行为识别任务中。该数据集通过收集不同行为模式下的加速度数据,如行走、慢跑、上楼和下楼等,为研究人员提供了一个标准化的基准数据集。通过分析这些数据,研究者可以训练和验证各种机器学习模型,以实现对跌倒行为的准确检测和分类。
解决学术问题
SisFallDataset 解决了在跌倒检测领域中缺乏标准化数据集的问题,尤其是在基于传感器数据的行为识别研究中。该数据集为研究人员提供了一个统一的框架,使得不同研究团队可以在相同的数据基础上进行比较和验证,从而推动了跌倒检测技术的进步。此外,该数据集的开放性也促进了跨学科的合作,为健康监测和老年人护理等领域的研究提供了重要的数据支持。
衍生相关工作
基于 SisFallDataset,许多研究工作得以展开,尤其是在行为识别和跌倒检测领域。例如,有研究者利用该数据集开发了基于深度学习的跌倒检测算法,显著提高了检测的准确性和鲁棒性。此外,该数据集还被用于验证多种机器学习模型的性能,如支持向量机、随机森林和卷积神经网络等。这些研究不仅推动了跌倒检测技术的发展,还为其他基于传感器数据的行为识别任务提供了参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录

微博与抖音评论数据集

数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。

github 收录

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录