five

aai530-group6/pmdata|体育数据分析数据集|健康监测数据集

收藏
hugging_face2024-01-22 更新2024-03-04 收录
体育数据分析
健康监测
下载链接:
https://hf-mirror.com/datasets/aai530-group6/pmdata
下载链接
链接失效反馈
资源简介:
PMData数据集旨在将传统的生活日志与运动活动日志相结合,以开发多种分析应用程序,例如利用额外的运动数据预测和分析日常发展(如体重和睡眠模式),以及利用传统生活日志数据在运动背景下预测运动员的表现。数据集通过Fitbit Versa 2智能手表、PMSys运动日志应用和Google表单收集了16个人5个月的日志数据。数据集结构包括每个参与者的文件夹,包含Fitbit、Google Docs和PMSys三个子文件夹,分别存储了不同的健康和生活数据。此外,还包含了食物图片的压缩文件。

PMData数据集旨在将传统的生活日志与运动活动日志相结合,以开发多种分析应用程序,例如利用额外的运动数据预测和分析日常发展(如体重和睡眠模式),以及利用传统生活日志数据在运动背景下预测运动员的表现。数据集通过Fitbit Versa 2智能手表、PMSys运动日志应用和Google表单收集了16个人5个月的日志数据。数据集结构包括每个参与者的文件夹,包含Fitbit、Google Docs和PMSys三个子文件夹,分别存储了不同的健康和生活数据。此外,还包含了食物图片的压缩文件。
提供机构:
aai530-group6
原始信息汇总

PMData 数据集

数据集概述

PMData 数据集旨在结合传统的生命日志和体育活动日志。该数据集支持开发多种有趣的分析应用,例如,可以使用额外的体育数据来预测和分析日常发展,如个人的体重和睡眠模式,以及在体育环境中使用传统的生命日志数据来预测运动员的表现。数据集使用了 Fitbit Versa 2 智能手表腕带、PMSys 体育日志应用和 Google 表单进行数据收集,包含了 16 名参与者 5 个月的数据。初步实验表明,这些分析是可能的,但仍有很大的改进空间。

数据集结构

数据集的主文件夹结构如下:

text [主文件夹] ├── p01 ├── p02 ├── ... ├── p16 └── participant-overview.xlsx

每个参与者的文件夹(pXX)包含以下内容:

  • fitbit [文件夹]

    • calories.json:显示上一分钟燃烧的卡路里数量。
    • distance.json:每分钟移动的距离,单位为厘米。
    • exercise.json:详细描述每次活动,包含日期、开始和结束时间、不同活动水平的时间、活动类型和各种性能指标(根据活动类型不同而异)。
    • heart_rate.json:在给定时间的心跳次数(每分钟)。
    • lightly_active_minutes.json:汇总每天的轻度活动分钟数。
    • moderately_active_minutes.json:汇总每天的中度活动分钟数。
    • resting_heart_rate.json:每天的静息心率。
    • sedentary_minutes.json:汇总每天的静坐分钟数。
    • sleep_score.csv:帮助理解每晚的睡眠情况,包含一个0-100的总体评分,由组成、恢复和持续时间评分、深度睡眠分钟数、静息心率和不安分评分组成。
    • sleep.json:每次睡眠的分解,包括浅睡、深度睡眠、REM睡眠和清醒时间。
    • steps.json:每分钟的步数。
    • time_in_heart_rate_zones.json:不同心率区间的分钟数。
    • very_active_minutes.json:汇总每天的高度活动分钟数。
  • googledocs [文件夹]

    • reporting.csv:每条记录包含报告日期、提交时间、餐食(早餐、午餐、晚餐和晚餐)、当天体重、饮水杯数和是否饮酒。
  • pmsys [文件夹]

    • injury.csv:显示受伤的时间和日期、受伤部位和轻微及严重程度。
    • srpe.csv:包含训练会话的结束时间、活动类型、感知努力(RPE)和持续时间(分钟)。
    • wellness.csv:包含时间、日期、疲劳、情绪、准备情况、睡眠时长、睡眠质量、酸痛(及酸痛部位)和压力。
  • food-images.zip:参与者1、3和5在2个月(2月和3月)内拍摄的所有食物(除水外)的照片。照片包含在.zip文件中,图像头部包含日期和时间信息。

使用条款

PMData 数据集的许可证为 Attribution-NonCommercial 4.0 International。更多信息请参见:https://creativecommons.org/licenses/by-nc/4.0/legalcode

引用

bibtex @inproceedings{10.1145/3339825.3394926, address = {New York, NY, USA}, author = {Thambawita, Vajira and Hicks, Steven Alexander and Borgli, Hanna and Stensland, H {a}kon Kvale and Jha, Debesh and Svensen, Martin Kristoffer and Pettersen, Svein-Arne and Johansen, Dag and Johansen, H {a}vard Dagenborg and Pettersen, Susann Dahl and Nordvang, Simon and Pedersen, Sigurd and Gjerdrum, Anders and Gro{}nli, Tor-Morten and Fredriksen, Per Morten and Eg, Ragnhild and Hansen, Kjeld and Fagernes, Siri and Claudi, Christine and Bio{}rn-Hansen, Andreas and Nguyen, Duc Tien Dang and Kupka, Tomas and Hammer, Hugo Lewi and Jain, Ramesh and Riegler, Michael Alexander and Halvorsen, P {a}l}, booktitle = {Proceedings of the 11th ACM Multimedia Systems Conference}, doi = {10.1145/3339825.3394926}, isbn = {9781450368452}, keywords = {sports logging, questionnaires, food pictures, neural networks, multimedia dataset, sensor data, machine learning}, location = {Istanbul, Turkey}, numpages = {6}, pages = {231-236}, publisher = {Association for Computing Machinery}, series = {MMSys 20}, title = {PMData: A Sports Logging Dataset}, url = {https://doi.org/10.1145/3339825.3394926}, year = {2020}, }

AI搜集汇总
数据集介绍
main_image_url
构建方式
PMData数据集的构建结合了传统生活日志与运动活动日志,旨在为健康与运动分析提供多维度的数据支持。数据采集过程中,研究团队采用了Fitbit Versa 2智能手表、PMSys运动日志应用以及Google表单等多种工具,历时五个月,收集了16名参与者的详细日志数据。这些数据涵盖了从日常活动到运动表现的多个方面,为后续的分析与应用奠定了坚实的基础。
特点
PMData数据集的特点在于其丰富的数据类型与多维度的信息整合。数据集不仅包含了心率、步数、卡路里消耗等基础生理指标,还涵盖了睡眠质量、运动强度、饮食记录等更为细致的健康数据。此外,数据集还引入了运动损伤、训练负荷等专业运动数据,为研究者提供了全面的分析视角。通过结合传统生活日志与运动日志,PMData能够支持从日常健康管理到运动表现预测的多种应用场景。
使用方法
PMData数据集的使用方法灵活多样,适用于多种健康与运动相关的研究与应用。研究者可以通过分析数据集中的生理指标与运动数据,探索个体健康状态与运动表现之间的关系。此外,数据集中的饮食记录与睡眠数据可用于研究生活习惯对健康的影响。对于机器学习与数据分析领域的研究者,PMData提供了丰富的特征数据,可用于构建预测模型或进行数据挖掘。使用该数据集时,需遵循CC BY-NC 4.0许可协议,确保非商业用途。
背景与挑战
背景概述
PMData数据集由Vajira Thambawita等研究人员于2020年创建,旨在将传统的生活日志记录与运动活动日志记录相结合。该数据集通过Fitbit Versa 2智能手表、PMSys运动日志应用和Google表单收集了16名参与者5个月的数据,涵盖了卡路里消耗、心率、睡眠质量、运动表现等多个维度。PMData的发布为开发分析应用程序提供了丰富的数据基础,特别是在预测和分析个人体重、睡眠模式以及运动员表现等方面具有重要应用价值。该数据集的研究成果发表于ACM多媒体系统会议,推动了健康监测与运动科学领域的交叉研究。
当前挑战
PMData数据集在解决健康监测与运动表现预测问题时面临多重挑战。首先,数据的高维度与异构性使得特征提取与模型训练变得复杂,尤其是在整合不同来源的数据时,如何有效融合时间序列数据与静态数据成为关键问题。其次,数据收集过程中存在参与者依从性问题,部分数据的缺失或不完整可能影响模型的泛化能力。此外,隐私保护与数据安全也是构建过程中不可忽视的挑战,如何在确保数据可用性的同时保护参与者隐私仍需进一步探索。最后,数据集的规模相对较小,可能限制了深度学习模型的性能,未来需要更大规模的数据集以提升模型的预测精度与鲁棒性。
常用场景
经典使用场景
PMData数据集在健康监测和运动分析领域具有广泛的应用。通过整合传统的生活日志和运动活动日志,该数据集为研究人员提供了一个多维度的视角,用于分析个体的日常行为和运动表现。例如,研究人员可以利用该数据集中的心率、步数和睡眠数据,深入探讨运动对体重和睡眠模式的影响,从而为个性化健康管理提供科学依据。
实际应用
在实际应用中,PMData数据集为健康管理和运动训练提供了有力的数据支持。例如,健身教练可以利用该数据集中的运动数据和健康指标,为会员制定个性化的训练计划。同时,医疗机构也可以利用该数据集中的睡眠和心率数据,评估患者的健康状况,并提供针对性的健康建议。这些应用不仅提高了健康管理的效率,还为个体健康提供了科学保障。
衍生相关工作
PMData数据集衍生了一系列相关研究,推动了健康监测和运动分析领域的发展。例如,基于该数据集的研究成果,研究人员开发了多种机器学习模型,用于预测运动员的表现和健康状况。此外,该数据集还为健康管理系统的开发提供了数据支持,推动了智能健康监测技术的发展。这些衍生工作不仅丰富了该领域的研究内容,还为实际应用提供了科学依据。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

GAOKAO-Bench

GAOKAO-Bench是由复旦大学计算机科学与技术学院创建的数据集,涵盖了2010至2022年间中国高考的所有科目题目,共计2811题。该数据集包含1781道客观题和1030道主观题,题型多样,包括单选、填空、改错、开放性问题等。数据集通过自动化脚本和人工标注将PDF格式的题目转换为JSON文件,数学公式则转换为LATEX格式。GAOKAO-Bench旨在为大型语言模型提供一个全面且贴近实际应用的评估基准,特别是在解决中国高考相关问题上的表现。

arXiv 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Plants of the World Online (POWO)

Plants of the World Online (POWO) 是一个全球植物数据库,提供了关于植物物种的详细信息,包括分类学、分布、生态学和保护状态等。该数据库旨在为植物学家、生态学家和公众提供一个全面的植物信息资源。

powo.science.kew.org 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

The Global Forest Watch (GFW)

The Global Forest Watch (GFW) 是一个全球森林监测平台,提供关于森林覆盖变化、火灾、森林砍伐和土地利用的实时数据和分析。数据集包括全球森林覆盖地图、森林砍伐警报、火灾热点、土地覆盖变化等信息。

globalforestwatch.org 收录