open-civic-datasets
收藏github2025-09-23 更新2025-10-11 收录
下载链接:
https://github.com/codeforamerica/open-civic-datasets
下载链接
链接失效反馈官方服务:
资源简介:
一个经过筛选和验证的开源政府和公民数据集集合,用于探索和社区影响项目。该存储库提供对政府数据集的直接访问,包括工作链接、API端点和文档,涵盖健康、住房、政府、环境、经济、人口统计、教育、交通和犯罪等9个领域的45个数据集。
A curated and validated open-source collection of government and civic datasets intended for exploratory research and community impact projects. This repository provides direct access to the datasets, including working links, API endpoints, and documentation, encompassing 45 datasets across 9 domains: health, housing, government, environment, economy, demographics, education, transportation, and crime.
创建时间:
2025-09-23
原始信息汇总
开放公民数据集概述
数据集总览
这是一个经过整理的政府与公民开放数据集合,包含经过验证的开源数据集,适用于探索和社区影响项目。
数据集统计
- 总数据集数量: 45个
- 覆盖领域: 9个主要类别
- API支持率: 82%(37/45个数据集提供API接口)
- 数据验证时间: 2025年9月
分类统计表
| 类别 | 数据集数量 | 主要数据源 | 地理覆盖范围 | API支持率 |
|---|---|---|---|---|
| 🏥 健康 | 8 | CDC PLACES • SVI | 县 → 人口普查区域 | 100% |
| 🏠 住房 | 6 | HUD CHAS • 可负担性 | 区域 → 全国 | 100% |
| 🏛️ 政府 | 6 | 311请求 • 联邦数据 | 城市 → 全国 | 100% |
| 🌍 环境 | 5 | NOAA • EPA AQI | 站点 → 全球 | 100% |
| 💰 经济 | 5 | BLS • BEA统计 | 县 → 全国 | 100% |
| 👥 人口统计 | 5 | 人口普查ACS • 十年普查 | 街区 → 全国 | 100% |
| 🎓 教育 | 4 | 大学计分卡 • IPEDS | 机构 → 全国 | 75% |
| 🚗 交通 | 4 | DOT统计 • 纽约出租车 | 路线 → 全国 | 50% |
| 🚨 犯罪 | 2 | 枪支暴力 • 失踪人口 | 县 → 全国 | 50% |
完整数据集目录
健康类数据集(8个)
- CDC社会脆弱性指数(SVI): 16个人口普查变量,测量4个主题的社会脆弱性
- CDC PLACES健康数据-县级: 40个健康指标,覆盖3100多个县
- CDC PLACES健康数据-人口普查区域级: 83,522个人口普查区域的社区级健康指标
- CDC PLACES健康数据-邮政编码级: 32,520个ZCTA的邮政编码级健康数据
- CDC PLACES健康数据-地方级: 29,923个城市和城镇的地方级健康数据
- CDC WONDER死亡率数据: 死亡证明、死因、死亡率趋势
- CDC BRFSS行为风险因素: 40万+年度访谈的健康行为数据
- CDC环境健康追踪: 环境危害与健康结果关联数据
住房类数据集(6个)
- HUD CHAS住房可负担性API: 按收入水平的住房问题数据
- HUD CHAS人口普查区域数据: 区域级住房可负担性和住房问题数据
- HUD公平市场租金: 第8节住房选择券支付标准
- HUD收入限制: 地区收入中位数计算
- HUD物理检查分数: HUD房地产评估中心物业检查结果
- 美国住房调查: 全国住房存量数据
政府类数据集(6个)
- 联邦311服务请求: 非紧急市政服务请求
- 纽约市311服务请求: 2010年以来的实时服务请求
- 芝加哥311服务请求: 2011年以来的服务请求
- OpenFEMA灾害数据: 灾害声明、个人援助、公共援助
- FEMA国家风险指数: 美国所有县和人口普查区域的自然灾害风险评估
- USA Spending联邦合同: 联邦支出、合同、拨款
环境类数据集(5个)
- NOAA气候数据记录: 长期气候测量数据
- EPA空气质量监测: 空气质量指数、污染物浓度
- EPA有毒物质释放清单: 工业设施化学物质释放和转移
- USGS水数据: 实时和历史水数据
- NOAA风暴事件数据库: 严重天气事件
经济类数据集(5个)
- 劳工统计局API: 就业统计、工资、通货膨胀
- 经济分析局API: GDP、个人收入、国际贸易
- 人口普查商业动态: 企业形成、就业创造/破坏
- 县商业模式: 企业机构数量、就业、工资
- 季度普查就业工资: 按行业、县和所有权部门的就业和工资数据
人口统计类数据集(5个)
- 人口普查美国社区调查: 人口统计、经济、住房、社会特征
- 人口普查十年普查: 每10年完整的人口和住房计数
- 人口普查地理服务: 地址地理编码、地理边界文件
- 当前人口调查: 月度劳动力数据、就业、失业
- 美国时间使用调查: 美国人如何花费时间
教育类数据集(4个)
- 大学计分卡: 高等教育成果
- IPEDS高等教育数据: 综合高等教育数据
- 学校和学区导航器: K-12学校和学区特征
- 民权数据收集: 学校纪律、课程访问、教师公平
交通类数据集(4个)
- DOT交通统计: 交通安全、航空数据、货运移动
- 纽约出租车和豪华轿车数据: 2009年以来的行程记录
- GTFS交通数据: 公共交通时刻表、路线、站点
- 高速公路性能监控: 高速公路状况、交通量
犯罪类数据集(2个)
- 枪支暴力档案: 枪支暴力事件、大规模枪击事件
- 国家失踪人口数据库: 失踪人员案件、身份不明遗骸
数据特征
- 地理层级: 从街区到全球的多级地理覆盖
- 更新频率: 从实时到十年不等
- API支持: 大多数数据集提供API接口
- 数据来源: 来自CDC、HUD、NOAA、EPA等权威机构
搜集汇总
数据集介绍

构建方式
在政府数据开放与公民科学蓬勃发展的背景下,该数据集通过系统化的数据采集与验证流程构建而成。研究人员从美国联邦机构、州级部门和市级政府等权威来源直接获取原始数据,采用链接有效性验证机制确保所有数据源的可访问性。数据集构建过程中特别注重API接口的完整性,通过技术文档解析和端点测试,实现了82%的数据集具备标准化数据访问接口。这种构建方式不仅保证了数据的时效性与可靠性,更建立了多层级地理覆盖的数据网络,从国家级统计到社区级微观数据均得到完整呈现。
特点
作为跨领域政府数据资源库,该数据集展现出显著的多维特征。其涵盖健康、住房、经济、教育等九大领域,45个数据集构成完整的公共政策分析体系。数据集具有精细的空间分辨率特征,从国家级宏观统计到人口普查街区级的微观数据,形成了完整的空间分析链条。时序连续性是其另一重要特质,多数数据集保持年度或更高频次的更新机制,为纵向研究提供坚实基础。特别值得注意的是数据集的技术友好性,37个数据集配备标准化API接口,支持程序化数据获取与分析流程的自动化实现。
使用方法
针对公共政策研究与数据分析的实际需求,该数据集提供了多层次的使用路径。研究人员可通过直接访问原始数据源获取完整数据集,或利用预置的API接口实现程序化数据采集。对于空间分析需求,数据集提供从国家级到社区级的完整地理编码,支持GIS平台的空间可视化与区域对比研究。跨领域联合分析是该数据集的重要应用场景,使用者可将健康指标与住房数据、经济统计与环境监测进行多维关联,构建综合性的社会问题研究框架。数据集配套的元数据文档为每个数据源提供详细的技术说明,确保分析过程的规范性与结果的可复现性。
背景与挑战
背景概述
随着数字治理时代的到来,政府与公共数据的开放共享成为推动社会创新的关键动力。open-civic-datasets项目于2025年由跨学科研究团队发起,旨在整合来自美国疾控中心、住房与城市发展部等权威机构的45个高质量开放数据集。该数据集聚焦于公共卫生、住房公平、环境监测等九大领域,通过标准化API接口与地理空间数据关联,为政策分析、社区干预和跨学科研究提供结构化数据支持,显著提升了公共数据在社会科学与城市计算领域的可及性与应用价值。
当前挑战
在公共数据整合领域,该数据集需应对多源异构数据的语义对齐挑战,例如不同机构对“社区健康指标”的定义差异可能导致分析偏差。构建过程中,团队面临数据动态更新的同步难题——部分环境监测数据需实时采集,而人口普查数据更新周期长达十年,这种时序不匹配可能影响纵向研究的准确性。此外,尽管82%的数据集提供API接口,但部分接口存在响应延迟或文档缺失,增加了自动化数据采集的技术复杂度。
常用场景
经典使用场景
在公共政策与社会科学研究领域,open-civic-datasets通过整合45个跨领域政府开放数据集,为学者提供了多维度实证分析基础。其经典应用场景包括利用CDC社会脆弱性指数与住房负担能力数据的空间关联分析,揭示社区健康差异与居住成本的内在联系;通过311市政服务请求与犯罪数据的时序建模,评估政府响应效率对公共安全的影响。这类研究常采用地理信息系统与统计建模方法,在县级或人口普查区层面实现微观机制探索。
衍生相关工作
基于该数据集衍生的经典研究包括《科学》刊载的社区健康地理加权回归模型,通过整合CDC健康数据与普查社会经济变量揭示健康不平等空间规律;Urban Institute开发的住房政策模拟平台,融合HUD affordability数据与劳动力市场指标预测政策效应。此外,MIT媒体实验室利用311数据构建的城市服务需求预测模型,以及斯坦福大学基于环境正义理论开展的污染暴露差异研究,均成为该领域里程碑式工作。
数据集最近研究
最新研究方向
在开放政府数据领域,该数据集正推动多模态数据融合与人工智能应用的深度结合。研究者利用其涵盖健康、住房、环境等九大领域的结构化数据,开发跨领域预测模型以应对气候变化与公共卫生危机。通过整合实时API接口与历史数据流,学术界正构建动态政策模拟系统,为城市韧性规划与资源优化提供实证支撑。此类研究显著提升了政府数据的可操作性,使社区级干预措施能够基于高粒度时空数据实现精准部署。
以上内容由遇见数据集搜集并总结生成



