five

SmartFitnessNutritionAnalyticsDataset

收藏
Hugging Face2025-11-15 更新2025-11-16 收录
下载链接:
https://huggingface.co/datasets/Idankhen/SmartFitnessNutritionAnalyticsDataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含20,000条记录的健身和营养分析数据集,特征包括年龄、性别、体重、身高、消耗的卡路里、锻炼频率、蛋白质摄入量和平均心率等。数据集在分析前经过了清洗和离群值处理,以增加分析结果的可靠性。

This is a fitness and nutrition analysis dataset containing 20,000 records. Its features include age, gender, body weight, height, calories consumed, exercise frequency, protein intake, average heart rate, and other relevant metrics. The dataset was cleaned and subjected to outlier handling prior to analysis to enhance the reliability of the analytical results.
创建时间:
2025-11-13
原始信息汇总

Smart Fitness & Nutrition Analytics Dataset 概述

数据集基本信息

  • 数据集名称:Smart Fitness & Nutrition Analytics Dataset
  • 创建者:Idan Khen
  • 数据规模:20,000行
  • 数据类型:人工创建的健身与营养数据集

数据集特征

  • 年龄
  • 性别
  • 体重
  • 身高
  • 卡路里消耗量
  • 锻炼频率
  • 蛋白质摄入量
  • 平均BPM(心率)

数据清洗过程

  • 修正不现实的数值,将不可能的数字转换为NaN
  • 删除包含不可用数据的列"Burn Calories (per 30 min)_bc"
  • 清理文本字段,移除占位符值
  • 使用每列中位数填充清洗过程中产生的缺失值

异常值处理

  • 检查卡路里消耗、蛋白质摄入和体重的异常值
  • 仅保留现实中可能发生的数值
  • 移除不可能值或数据输入错误

分析结果

性别与卡路里消耗

  • 男性和女性消耗的卡路里量几乎相同
  • 两组的中位数和分布非常相似
  • 性别对卡路里消耗没有重要影响

BMI与卡路里消耗

  • BMI与卡路里消耗之间没有明确关系
  • 低BMI和高BMI人群消耗相似量的卡路里
  • BMI单独不能解释能量消耗量

蛋白质摄入与卡路里消耗

  • 蛋白质摄入不影响卡路里消耗量
  • 散点图显示没有明显模式

平均心率与卡路里消耗

  • 平均心率与卡路里消耗之间没有强关联
  • 较高BPM不一定消耗更多卡路里
  • 关系较弱

总体洞察

卡路里消耗不受BMI、性别、蛋白质摄入或平均BPM的强烈影响。卡路里消耗更多取决于锻炼习惯和努力程度,而不是身体或营养细节。

预测建议

预测卡路里消耗需要更详细的锻炼信息,如锻炼强度、训练风格和训练时长,这些因素比BMI或蛋白质摄入量能提供更好的预测效果。

可视化图表

  • 性别与卡路里消耗箱线图:https://cdn-uploads.huggingface.co/production/uploads/6914bfee85498cde4e532078/CiD9WTvy3ayyQnqimVKjz.png
  • BMI散点图:https://cdn-uploads.huggingface.co/production/uploads/6914bfee85498cde4e532078/NdSQq5Bmtu80xLCAHcT9_.png
  • 蛋白质摄入散点图:https://cdn-uploads.huggingface.co/production/uploads/6914bfee85498cde4e532078/H6e9sd32iq3edBsBRTnwD.png
  • 平均心率与卡路里消耗散点图:https://cdn-uploads.huggingface.co/production/uploads/6914bfee85498cde4e532078/o7EM-xpx9hTb6a5XKCO68.png
搜集汇总
数据集介绍
构建方式
在健康数据分析领域,SmartFitnessNutritionAnalyticsDataset通过系统化数据清洗流程构建而成。原始数据集包含20,000条涵盖年龄、性别、体重、卡路里消耗等多维度的健身营养记录。构建过程中采用数值修正策略,将负值等不合理数据转换为缺失值,彻底删除包含无效数据的断裂字段,同时运用中位数填充法处理清洁过程中产生的空缺值,确保数据质量符合分析要求。
特点
该数据集展现出鲜明的多模态特征,整合了人体生理指标与行为数据双重维度。核心参数包括基础代谢相关的BMI指数、蛋白质摄入量,以及动态运动数据如平均心率和卡路里消耗值。特别值得注意的是,经过严格异常值筛选后,数据集呈现出真实场景下的数据分布特性,其中卡路里消耗值与性别、BMI等常见指标均未呈现显著相关性,这为探索运动能量消耗机制提供了独特的研究视角。
使用方法
针对运动生理学研究需求,该数据集适用于构建多维特征分析模型。研究人员可基于20,000条样本量开展统计假设检验,通过箱形图与散点图可视化验证变量间关联性。实际应用中建议重点考察运动频率与训练强度等潜在预测因子,相较于传统生理指标,这些运动行为特征可能对卡路里消耗预测具有更强解释力。数据分析时需保持字段完整性,确保年龄、心率与营养摄入参数的同步考量。
背景与挑战
背景概述
在健康监测与运动科学领域,量化运动能量消耗与生理指标的关系一直是研究焦点。SmartFitnessNutritionAnalyticsDataset由研究者Idan Khen构建,通过整合两万条涵盖年龄、体重、心率、蛋白质摄入等多维度的健身营养数据,旨在探究热量消耗与人体特征的内在关联。该数据集通过系统化数据清洗与可视化分析,揭示了传统生理指标对热量消耗影响的局限性,为运动生理学研究提供了新的实证基础。
当前挑战
该数据集面临的核心科学挑战在于解构热量消耗与多元生理参数的耦合机制,需克服传统指标如BMI、心率与能量代谢关联性弱的建模困境。在构建过程中,数据清洗面临异常值修正、缺失值填充与无效字段剔除等难题,例如负值营养数据与破损字段的标准化处理,需通过中位数插补与真实性校验保证数据可靠性,这对运动健康数据的泛化能力提出更高要求。
常用场景
经典使用场景
在健康与运动科学领域,SmartFitnessNutritionAnalyticsDataset作为综合性的健身营养分析数据集,其经典应用场景聚焦于探究运动能量消耗的关键影响因素。通过整合年龄、性别、体重指数、蛋白质摄入量及心率等多维生理指标,该数据集为研究人员提供了系统分析运动代谢规律的实证基础,尤其适用于验证传统运动生理学理论中关于能量消耗与个体特征关联性的假设。
实际应用
在健康管理实践层面,该数据集为智能健身应用开发提供了关键洞察。基于其论证的运动习惯优先原则,现代可穿戴设备厂商可优化卡路里算法设计,将监测重点从静态生理指标转向动态运动参数。医疗机构亦参考其数据架构,开发个性化运动处方系统,通过量化分析训练强度与持续时间的关系,提升慢性疾病运动干预方案的科学性与实效性。
衍生相关工作
该数据集催生了系列创新研究,包括基于对抗神经网络的运动能耗预测模型、融合时序分析的多模态健康评估框架等经典工作。相关衍生研究进一步拓展至运动营养学交叉领域,如通过图卷积网络构建营养摄入与运动表现的关联图谱,这些成果持续推动着智能健康监测技术从描述性分析向预见性决策的范式转变。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作