five

us-inequality-atlas

收藏
Hugging Face2026-02-14 更新2026-02-15 收录
下载链接:
https://huggingface.co/datasets/lukeslp/us-inequality-atlas
下载链接
链接失效反馈
官方服务:
资源简介:
US Inequality Atlas 是一个涵盖美国约3,200个县的县级不平等数据的开源数据集,使用5位FIPS代码作为主键。数据集包含多个领域的不平等指标,如食品荒漠、医疗保健可及性、住房负担能力、医院基础设施、退伍军人口统计、残疾流行率、收入不平等(基尼系数)、教育程度、失业率和贫困深度。数据来源包括美国人口普查局的ACS、美国农业部的食品可及性研究图集、CMS的医院比较数据以及HRSA的健康专业短缺地区数据。数据集适用于表格分类和特征提取任务,特别适合用于不平等现象的可视化和分析。数据集中的每个文件都使用FIPS代码作为合并键,便于不同数据集之间的连接和分析。
创建时间:
2026-02-09
原始信息汇总

US Inequality Atlas 数据集概述

数据集基本信息

  • 数据集名称:US Inequality Atlas
  • 许可证:MIT
  • 主要任务类别:表格分类、特征提取
  • 语言:英语
  • 数据规模:1K<n<10K
  • 地理范围:美国县级(约3,200个县)
  • 关键标识:5位FIPS代码

核心主题与标签

不平等、食物荒漠、医疗保健、住房、退伍军人、残疾、教育、经济学、基尼系数、人口普查、FIPS、县级、美国。

数据内容与结构

数据集包含美国县级不平等数据,涵盖多个主题领域,所有县级文件均使用5位FIPS代码作为合并主键。

食物荒漠 (food_deserts/)

  • food_desert_merged.csv:3,222个县的数据,来源为 Census ACS 2021 与 USDA Food Access Atlas 2019。
  • 多个JSON文件:包含州级排名、最差县排名、儿童影响指标、SNAP覆盖差距、区域分析及国家汇总统计数据。

医疗保健 (healthcare/)

  • healthcare_desert_merged.csv:3,222个县的数据,来源为 Census ACS 2022 与 HRSA HPSA。
  • cms_hospitals_2025.csv:5,421家医院的数据,来源为 CMS Hospital Compare。

住房 (housing/)

  • housing_crisis_merged.csv:3,222个县的数据,来源为 Census ACS 2022(租金负担、收入、单元数)。

退伍军人 (veterans/)

  • 多个CSV文件:涵盖州/地区级分析、退伍军人口统计、PTSD与心理健康指标、退伍军人自杀率、VA医疗保健注册、枪支拥有率等主题,另包含4个元数据CSV文件。

经济 (economic/)

  • gini_by_county.csv:3,222个县的基尼系数数据,来源为 Census ACS 2022 (B19083)。
  • unemployment_by_county.csv:3,222个县的失业率数据,来源为 Census ACS 2022 (B23025)。
  • poverty_depth_by_county.csv:3,222个县的贫困深度数据,来源为 Census ACS 2022 (C17002)。

教育 (education/)

  • education_by_county.csv:3,222个县的教育程度数据,来源为 Census ACS 2022 (B15003)。

残疾 (disability/)

  • census_disability_by_county_2022.csv:3,222个县的残疾人口数据,来源为 Census ACS 2022 (S1810)。

CMS医院 (cms/)

  • cms_hospitals_20260121.csv:5,421家医院的数据,来源为 CMS Hospital Compare(2026年1月更新)。

源数据 (source/)

  • food_access_atlas_2019.xlsx:原始 USDA Food Access Research Atlas 数据(82 MB,使用 Git LFS)。

数据来源

  • American Community Survey:美国人口普查局(https://data.census.gov)
  • Food Access Research Atlas:美国农业部经济研究局(https://www.ers.usda.gov/data-products/food-access-research-atlas/)
  • Hospital Compare:美国医疗保险和医疗补助服务中心(https://data.cms.gov/provider-data/dataset/xubh-q36u)
  • Health Professional Shortage Areas:美国卫生资源和服务管理局(https://data.hrsa.gov)
  • Veteran Statistics:美国退伍军人事务部与美国疾病控制与预防中心(多来源)

相关链接

  • 完整数据集目录:https://dr.eamer.dev/datavis/data_trove/
  • 作者个人网站:https://lukesteuber.com
  • HuggingFace数据集页面:https://huggingface.co/datasets/lukeslp/us-inequality-atlas
  • Kaggle数据集页面:https://www.kaggle.com/datasets/lucassteuber/us-inequality-atlas
搜集汇总
数据集介绍
main_image_url
构建方式
在社会科学与公共政策研究领域,全面且精细的县级数据对于深入理解社会不平等现象至关重要。US Inequality Atlas 数据集通过整合美国人口普查局(Census ACS)、美国农业部(USDA)、医疗保险和医疗补助服务中心(CMS)以及卫生资源与服务管理局(HRSA)等多个联邦机构的权威公开数据构建而成。其核心构建逻辑是以五位数FIPS代码作为统一的地理标识键,系统性地汇集了全美约3200个县在食品荒漠、医疗可及性、住房负担能力、退伍军人状况、残疾率、收入不平等(基尼系数)、教育程度、失业率及贫困深度等多个维度的指标。这种多源异构数据的融合与标准化处理,确保了数据集在空间单元上的一致性与可连接性,为跨主题的综合性分析奠定了坚实基础。
使用方法
在应用层面,该数据集为量化研究与政策评估提供了直接支持。使用者可通过Python的Pandas库加载特定主题的CSV文件,利用FIPS代码作为连接键,灵活地合并不同领域的数据以创建综合指标。例如,将食品荒漠数据与贫困率数据关联,可以识别出多重劣势叠加的县域。数据集同样适用于数据可视化,其标准化的地理编码能够无缝对接D3.js等工具进行专题地图(如等值区域图)的绘制。无论是进行描述性统计分析、构建回归模型以探究不平等的影响因素,还是生成交互式仪表板以支持决策,该数据集结构化的多源信息都为深入剖析美国县级层面的社会不平等格局提供了高效、可靠的数据基础。
背景与挑战
背景概述
美国不平等图集(US Inequality Atlas)是由研究人员Luke Steuber基于美国联邦机构公开数据汇编而成的县级层面综合数据集,其核心研究问题聚焦于系统性地量化与可视化美国各郡县在食品荒漠、医疗可及性、住房负担、退伍军人状况、残疾人口、收入不平等、教育程度及贫困深度等多维度的社会不平等现象。该数据集整合了美国人口普查局(Census ACS)、美国农业部(USDA)、医疗保险与医疗补助服务中心(CMS)以及卫生资源与服务管理局(HRSA)等多个权威来源的2021至2022年最新数据,旨在为社会科学、公共政策及数据可视化研究提供高颗粒度的实证基础,推动对地域性不平等结构的深入分析与跨领域比较。
当前挑战
该数据集致力于应对社会不平等量化研究中的核心挑战,即如何将分散于不同部门、统计口径各异的多源异构数据,整合为统一、可互操作的标准化指标体系,以支持跨郡县的横向对比与纵向趋势分析。在构建过程中,面临数据融合的技术性难题,包括不同来源数据的时空对齐、缺失值处理、指标定义一致性维护,以及确保以五位数FIPS代码为关键合并键的跨表连接可靠性。此外,原始数据中存在的测量误差、统计偏差及更新频率差异,亦对构建全面且时效性强的县级不平等全景图提出了持续的数据治理挑战。
常用场景
经典使用场景
在社会科学与公共政策研究领域,US Inequality Atlas数据集为学者提供了全面分析美国县级不平等现象的基础框架。该数据集最经典的应用场景在于通过多维度指标的交叉分析,揭示不同地区在食品获取、医疗资源、住房负担等关键民生领域的结构性差异。研究者常利用其标准化的FIPS编码体系,将经济不平等指标与教育水平、残疾人口分布等社会变量进行空间关联分析,从而构建出反映美国社区福祉差异的综合图谱。这种跨领域的数据整合能力,使其成为衡量区域发展均衡性的重要实证工具。
解决学术问题
该数据集有效解决了传统不平等研究中数据碎片化的学术困境。通过整合人口普查、农业部、医疗服务中心等权威机构的标准化数据,研究者能够系统性地探讨收入基尼系数与医疗资源可及性之间的空间关联,分析退伍军人群体与住房负担压力的交叉影响,以及检验教育成就与食品荒漠分布的地理相关性。这种多维度的数据架构为验证区域发展理论、评估政策干预效果提供了可靠的实证基础,推动了不平等研究从单一维度向系统化分析的范式转变。
实际应用
在公共政策制定与社会服务规划中,该数据集发挥着重要的决策支持功能。地方政府可利用其县级医疗资源分布数据优化急诊服务网络布局,非营利组织能依据食品荒漠指标精准定位营养援助项目的实施区域。城市规划者通过住房负担与收入数据的空间叠加,识别保障性住房建设的优先区域。公共卫生部门则可结合残疾人口分布与医院基础设施数据,制定差异化的康复服务方案。这些应用显著提升了社会资源分配的精准性与公平性。
数据集最近研究
最新研究方向
在区域不平等研究领域,US Inequality Atlas数据集正推动多维度交叉分析的前沿探索。研究者们借助其涵盖食品荒漠、医疗可及性、住房负担、退伍军人状况及经济不平等指标的县层级数据,深入剖析结构性不平等的空间分布与复合效应。当前热点聚焦于运用机器学习模型预测社会脆弱性,并结合气候变化、公共卫生事件等外部冲击,评估区域韧性与政策干预效果。这类研究不仅为精准社会治理提供实证依据,也促进了跨学科对话,深化了对美国社会地理分异机制的理解。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作