five

DNPAO_cleaned.csv

收藏
github2024-05-07 更新2024-05-31 收录
下载链接:
https://github.com/hatkiet/Project_3_RedTeam
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含美国各种人口统计信息,如教育、年龄、种族、性别和收入,以及它们与肥胖、运动和饮食习惯的关系。数据集特别关注自称为成人肥胖百分比的个体数据。

This dataset encompasses a variety of demographic information from the United States, including education, age, race, gender, and income, along with their relationships to obesity, exercise, and dietary habits. The dataset particularly focuses on individual data reporting the percentage of adults who identify as obese.
创建时间:
2024-04-12
原始信息汇总

数据集概述

项目目的

  • 分析目标: 该项目旨在分析美国人口的肥胖趋势与人口统计信息之间的关系。
  • 数据来源: 数据集来源于BRFSS(行为风险因素监测系统),由CDC的DNPAO(营养、体育活动和肥胖部门)使用。

数据内容

  • 数据类型: 包含多种人口统计信息,如教育、年龄、种族、性别和收入。
  • 数据处理: 原始数据经过收集和修正,专注于饮食、运动和肥胖相关问题。创建了一个名为DNPAO_cleaned.csv的精简数据集,仅包含自认为“成人肥胖百分比”的数据。

数据可视化

  • 可视化工具: 使用Python和JavaScript创建交互式可视化。
  • 可视化内容:
    • 3D图表: 显示各州不同年龄组的肥胖百分比。
    • 地图和图表: 展示全国及各州的肥胖率,按年龄、教育、收入、性别和种族/民族分类。

数据伦理

  • 数据保护: 数据以匿名方式处理,每个记录仅包含州、年份和年龄组信息,不包含其他个人识别信息,以防止数据被用于识别特定个人。

数据源参考

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自美国行为风险因素监测系统(BRFSS),由美国疾病控制与预防中心(CDC)的营养、体育活动和肥胖部门(DNPAO)提供。数据集经过精心筛选和修正,专注于18岁及以上成年人的肥胖率,并涵盖了教育、年龄、种族、性别和收入等多个社会经济因素。通过使用missingno库进行数据可视化和清理,剔除了不必要的列并确保数据完整性,最终生成了名为DNPAO_cleaned.csv的精简数据集。
特点
该数据集具有高度细化的特点,涵盖了多个社会经济因素对肥胖率的影响,包括教育、年龄、种族、性别和收入等。此外,数据集还提供了每个州的总体肥胖率以及全国的总体数据,便于进行区域和全国范围的比较分析。数据集的清理过程确保了数据的完整性和准确性,为后续的深入分析奠定了坚实基础。
使用方法
用户可通过Python脚本'First_Clean.ipynb'进行数据清理和初步分析,利用missingno库可视化数据缺失情况并进行清理。数据存储于PostGreSQL数据库中,并可导出为CSV格式进行进一步分析。项目还提供了HTML和JavaScript脚本,支持用户通过交互式界面进行数据筛选和可视化,利用Flask后端提供API服务,实现动态数据展示和分析。
背景与挑战
背景概述
DNPAO_cleaned.csv数据集由Red Team团队创建,旨在分析美国人口的肥胖趋势与其人口统计学特征之间的关系。该数据集源自美国疾病控制与预防中心(CDC)的营养、体育活动和肥胖部门(DNPAO)的行为风险因素监测系统(BRFSS)。通过收集和整理与饮食、运动和肥胖相关的数据,研究团队特别关注了教育、年龄、种族、性别和收入等因素对肥胖率的影响。该数据集不仅提供了各州的总体肥胖率,还为全国范围内的肥胖趋势提供了综合分析,为公共卫生领域的研究提供了宝贵的资源。
当前挑战
该数据集在构建过程中面临多项挑战。首先,原始数据集规模庞大,包含多种类别和问题,需进行精细的筛选和清理,以确保数据的准确性和相关性。其次,数据中存在缺失值,需借助外部库如missingno进行可视化处理,并删除不必要的列以消除缺失数据。此外,由于数据的高度分层特性,难以直接在不同分层之间建立关联性,这增加了分析的复杂性。最后,数据隐私和伦理问题也是一大挑战,需确保数据报告方式不会泄露个人隐私。
常用场景
经典使用场景
DNPAO_cleaned.csv数据集的经典使用场景主要集中在分析美国成年人口的肥胖趋势与其社会经济因素之间的关系。通过该数据集,研究者能够深入探讨年龄、性别、种族、教育水平和收入等人口统计学变量对肥胖率的影响。例如,研究者可以利用该数据集生成各州不同年龄段的肥胖率分布图,或分析不同教育水平下的肥胖率差异,从而为公共卫生政策制定提供科学依据。
衍生相关工作
基于DNPAO_cleaned.csv数据集,研究者已开展了多项相关工作。例如,有研究通过该数据集分析了不同种族群体的肥胖率差异,揭示了种族因素在肥胖流行中的作用。此外,还有研究利用该数据集探讨了教育水平与肥胖率之间的关系,为教育政策与健康政策的协同提供了新的视角。这些衍生研究不仅丰富了肥胖领域的理论体系,还为实际应用提供了更多可能性。
数据集最近研究
最新研究方向
近年来,DNPAO_cleaned.csv数据集在肥胖趋势与人口统计学因素的关系研究中展现出显著的前沿性。该数据集聚焦于美国成年人的肥胖率,并通过多维度的统计分析,揭示了年龄、教育、种族、性别和收入等因素对肥胖率的影响。特别是在2022年的研究中,研究人员通过3D可视化技术,深入探讨了各州不同年龄组的肥胖分布情况,进一步验证了肥胖率与收入水平之间并非简单的线性关系。这一发现为公共卫生政策的制定提供了新的视角,强调了多因素综合干预的重要性。此外,该数据集的应用还引发了关于数据隐私和伦理问题的讨论,推动了数据匿名化和安全处理技术的进一步发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作