World Happiness Report|幸福研究数据集|社会科学数据集
收藏World Happiness Report Analysis
数据集概述
本项目分析《世界幸福报告》数据集,以了解影响不同国家幸福感的因素。通过检查2015年和2023年的数据,旨在识别幸福感的决定性因素,探索地区差异,并开发幸福分数的预测模型。
数据文件
本仓库包含以下文件:
- World_Happiness_Report_Analysis.ipynb: 包含完整分析的Jupyter Notebook,包括数据预处理、探索性数据分析(EDA)、相关性分析和机器学习模型。
- 2015.csv: 包含2015年《世界幸福报告》数据的集,用于收集地区信息。
- WHR2023.csv: 包含2023年《世界幸福报告》数据的集,作为主要分析数据集。
数据来源
本分析使用的数据集来自Kaggle:
项目目标
- 识别影响幸福感的因素: 确定影响幸福分数的最重要变量,如GDP、社会支持和预期寿命。
- 地区幸福感分析: 探索不同地区的幸福感差异,并识别不同地区的趋势。
- 分类和预测: 开发机器学习模型,基于关键因素对幸福分数进行分类和预测。
分析方法
分析通过以下步骤进行:
- 数据预处理: 处理缺失值,数据归一化,合并数据集以进行综合分析。
- 探索性数据分析(EDA): 可视化和分析数据分布、异常值和地区趋势。
- 相关性分析: 使用统计方法识别幸福分数与各种因素之间的关系。
- 机器学习模型: 实施决策树回归和线性回归来预测幸福分数。
结果概览
- 关键因素: GDP、社会支持和健康预期寿命是影响幸福分数的最重要因素。
- 地区分析: 西欧、北美、澳大利亚和新西兰的幸福分数最高,而亚洲和非洲则落后。
- 预测模型: 决策树回归模型解释了大约83%的幸福分数变异,显示其有效性。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
Global Volcanism Program (GVP)
该数据集包含了全球火山活动的详细信息,包括火山的位置、类型、历史喷发记录、喷发频率等。数据集还提供了关于火山活动的研究报告和相关文献的链接。
volcano.si.edu 收录