Sleep Efficiency|睡眠研究数据集|健康数据分析数据集
收藏睡眠效率数据集分析
概述
本仓库包含使用Python和统计方法分析“睡眠效率”数据集的代码和文档。该数据集包含与睡眠模式和影响睡眠效率的因素相关的各种变量,包括年龄、性别、就寝时间、醒来时间、睡眠持续时间、REM睡眠百分比、深度睡眠百分比、浅度睡眠百分比、觉醒次数、咖啡因摄入量、酒精摄入量、吸烟状况和锻炼频率。我们的目标是探索、分析并从这些数据中提取见解。
描述
“睡眠效率”数据集包含关于睡眠模式和影响睡眠效率的因素的信息。每个条目代表一个独特个体的睡眠数据,并包括以下列:
- ID: 每个个体的唯一标识符。
- Age: 个体的年龄。
- Gender: 个体的性别。
- Bedtime: 个体就寝的时间。
- Wakeup time: 个体醒来的时间。
- Sleep duration: 睡眠持续时间。
- Sleep efficiency: 睡眠效率。
- REM sleep percentage: REM睡眠百分比。
- Deep sleep percentage: 深度睡眠百分比。
- Light sleep percentage: 浅度睡眠百分比。
- Awakenings: 个体在睡眠中觉醒的次数。
- Caffeine consumption: 摄入的咖啡因量。
- Alcohol consumption: 摄入的酒精量。
- Smoking status: 个体的吸烟状况。
- Exercise frequency: 锻炼频率。
仓库结构
Sleep_Efficiency.csv
: 包含用于分析的原始数据文件。Sleep_Efficiency_dataset.ipynb
: 包含数据探索、预处理、分析和可视化代码的Jupyter笔记本。
依赖项
- Python
- Pandas
- NumPy
- SciPy
- Matplotlib
- Seaborn
- Plotly Express
- Statsmodels
- Jupyter Notebook
入门指南
- 将本仓库克隆到您的本地机器。
- 导航到项目目录。
- 使用
pip install -r requirements.txt
安装所需的依赖项。 - 探索Jupyter笔记本
Sleep_Efficiency_dataset.ipynb
以了解分析过程。 - 运行笔记本或脚本以重现分析和结果。
- 参考代码中的文档和注释以获取更详细的解释。

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
人民日报语料库
该数据集包含2023年5月至2024年4月期间人民日报的全部文章,以JSON格式保存,每篇文章包含URL、标题和内容。
github 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
The Global Forest Watch (GFW)
The Global Forest Watch (GFW) 是一个全球森林监测平台,提供关于森林覆盖变化、火灾、森林砍伐和土地利用的实时数据和分析。数据集包括全球森林覆盖地图、森林砍伐警报、火灾热点、土地覆盖变化等信息。
globalforestwatch.org 收录
CHFS中国家庭金融调查数据
中国家庭金融调查(China Household Finance Survey, CHFS)是中国家庭金融调查与研究中心(以下简称“中心”)在全国范围内开展的抽样调查项目,旨在收集有关家庭金融微观层次的相关信息,主要内容包括:人口特征与就业、资产与负债、收入与消费、社会保障与保险以及主观态度等相关信息,对家庭经济、金融行为进行了全面细致刻画。 CHFS基线调查始于2011年,目前已分别在2011、2013、2015、2017和2019年成功实施五轮全国范围内的抽样调查项目,2021年第六轮调查还在进行中。CHFS最新公开的2019年第五轮调查数据,样本覆盖全国29个省(自治区、直辖市),343个区县,1360个村(居)委会,样本规模达34643户,数据具有全国及省级代表性。
CnOpenData 收录