five

Accessibility Atlas

收藏
github2026-02-16 更新2026-02-17 收录
下载链接:
https://github.com/lukeslp/accessibility-atlas
下载链接
链接失效反馈
官方服务:
资源简介:
Accessibility Atlas 是一个包含42个关于美国及全球残疾人口统计、就业、网络可访问性、辅助技术专利、特殊教育、医疗保健、住房歧视、交通和政府福利等数据集的集合。这些数据来自多个联邦机构、国际组织和倡导团体,经过统一格式化处理,便于使用。

Accessibility Atlas is a collection of 42 datasets covering disability population statistics, employment, web accessibility, assistive technology patents, special education, healthcare, housing discrimination, transportation, government welfare programs and other related topics in the United States and globally. These datasets are sourced from multiple federal agencies, international organizations and advocacy groups, and have been uniformly formatted for ease of use.
创建时间:
2026-02-09
原始信息汇总

Accessibility Atlas 数据集概述

数据集基本信息

  • 数据集名称:Accessibility Atlas
  • 数据集数量:62个数据集
  • 核心主题:美国及全球范围内的残障相关数据
  • 数据涵盖领域:人口统计、就业、网络无障碍、辅助技术专利、特殊教育、医疗保健、住房歧视、交通、政府福利等
  • 数据来源:数十个联邦机构、国际组织和倡导团体
  • 数据格式:统一格式化,便于使用
  • 许可证:MIT License(数据集本身),各原始数据集遵循其各自许可证(详见来源表)

数据集分类与内容

1. 美国残障人口统计(人口普查局)

  • 数据量:10个数据集
  • 来源:美国社区调查(ACS)
  • 覆盖范围:县、州和国家层面的残障率
  • 关键文件示例
    • census_disability_by_county_2022.csv:覆盖3100多个县
    • census_disability_states_2023.json:覆盖50个州、华盛顿特区和波多黎各
    • census_disability_national_trends.json:5年趋势(12.68% 至 13.45%)
    • census_disability_trends_clean.json:13年趋势(11.9% 至 13.6%)

2. 残障与就业

  • 数据量:5个数据集
  • 内容:就业差距、歧视投诉和工作场所便利设施
  • 关键文件示例
    • bls_disability_employment_2024.json:按残障状况划分的BLS就业/失业数据
    • eeoc_ada_charges.json:33年ADA歧视投诉数据(1992-2024)
    • jan_workplace_accommodations.json:JAN便利设施成本数据

3. 特殊教育(IDEA)

  • 数据量:6个数据集
  • 来源:国家教育统计中心(NCES)
  • 内容:根据IDEA B部分服务的学生数据
  • 关键文件示例
    • idea_special_education_enriched.json:750万学生,51个州,13个残障类别,1976-2023年
    • nces_204_30_disability_type.xlsx:NCES表204.30

4. 网络无障碍

  • 数据量:5个数据集
  • 内容:WCAG合规性、诉讼、屏幕阅读器使用情况、联邦第508条合规性
  • 关键文件示例
    • webaim_million_2025.json:前100万页面的WCAG失败情况
    • ada_digital_lawsuits.json:ADA数字诉讼 2017-2024
    • section_508_compliance_2024.json:联邦机构第508条合规性(245个实体)

5. 国际残障数据

  • 数据量:9个数据集
  • 覆盖范围:194个以上国家的全球残障流行率、健康指标和政策
  • 关键文件示例
    • who_disability_prevalence.json:194个国家 + SDG指标(25MB)
    • oecd_disability_data.json:34个OECD国家:流行率、就业、支出
    • un_crpd_ratification.json:199个国家:CRPD批准状态

6. 政府福利(SSA & VA)

  • 数据量:3个数据集
  • 内容:社会保障残障、SSI和VA补偿
  • 关键文件示例
    • ssa_ssdi_ssi_annual.json:SSDI/SSI受益者 1970-2024
    • va_disability_compensation.json:VA索赔 2019-2026,各州补偿率

7. 医疗保健与心理健康

  • 数据量:3个数据集
  • 内容:医疗补助残障登记和心理健康流行率
  • 关键文件示例
    • cms_medicaid_disability_enrollment.json:CMS老年/盲人/残障登记 2013-2024(4.7MB)
    • samhsa_mental_health.json:NSDUH心理健康流行率 2008-2023

8. 住房歧视

  • 数据量:1个数据集
  • 内容:HUD公平住房投诉
  • 关键文件hud_fair_housing_disability.json:HUD公平住房投诉 2009-2023,按州划分

9. 交通

  • 数据量:2个数据集
  • 内容:ADA辅助客运系统乘车人数和成本
  • 关键文件示例
    • ntd_paratransit_data.json:ADA辅助客运系统乘车人数和成本 2014-2022
    • ntd_paratransit_latest.json:NTD辅助客运系统 2022-2023,来自data.transportation.gov的5000条机构记录

10. 教育(民权)

  • 数据量:1个数据集
  • 内容:第504条、约束/隔离、纪律
  • 关键文件crdc_disability_data.json

11. 辅助技术专利

  • 数据量:1个数据集
  • 内容:WIPO辅助技术专利
  • 关键文件patentsview_assistive_tech.json:WIPO辅助技术专利 1985-2026(696KB)

12. 视觉无障碍

  • 数据量:1个数据集
  • 内容:来自盲人用户的视觉问答对
  • 关键文件vizwiz_val_annotations.csv:来自VizWiz VQA的4319个VQA对

13. CDC残障与健康

  • 数据量:2个数据集
  • 内容:CDC DHDS州级残障流行率
  • 关键文件示例
    • cdc_dhds_disability_prevalence.csv:来自BRFSS的CDC DHDS州级残障流行率(3592条记录,所有州)

14. 参考文件

  • 数据量:1个数据集
  • 内容:包含来源、覆盖范围和关键发现的完整数据集目录
  • 关键文件dataset_index.json

配套分析工具

  • Notebooks数量:10个Jupyter Notebook
  • 位置notebooks/ 目录下
  • 功能:加载数据、运行基本分析并生成图表
  • 涵盖类别:人口普查残障人口统计、残障就业、网络无障碍、国际残障数据、特殊教育、政府福利、医疗保健心理健康、住房交通教育、辅助技术、手语视觉AAC
  • 快速入门示例:根目录下的 accessibility_atlas_demo.ipynb

数据来源与许可证摘要

  • 主要政府来源:美国人口普查局、劳工统计局、教育部、卫生与公众服务部等(公共领域)
  • 国际组织来源:世界卫生组织(CC BY-NC-SA 3.0 IGO)、世界银行(CC BY 4.0)、OECD(OECD条款)、联合国(公共领域)、欧盟统计局(欧盟统计局版权政策)
  • 其他来源:WebAIM(合理使用)、VizWiz(CC BY 4.0)、WIPO(公共领域)等

数据记录格式示例

  • 人口普查县残障数据:包含FIPS代码、县名、总人口、残障总数、残障率等字段的CSV
  • WHO HALE数据:包含国家代码、地区、年份、HALE年份的长格式CSV
  • OECD就业差距数据:包含国家、残障就业百分比、非残障就业百分比、差距百分点的JSON
  • SSA SSDI受益者数据:包含年份、残障工人数量、平均月福利的JSON

分发平台

  • HuggingFace:https://huggingface.co/datasets/lukeslp/accessibility-atlas
  • Kaggle:https://www.kaggle.com/datasets/lucassteuber/accessibility-atlas

作者

Luke Steuber

搜集汇总
数据集介绍
构建方式
在无障碍研究领域,数据往往分散于众多联邦机构、国际组织及倡导团体之中,使得系统性分析面临挑战。Accessibility Atlas 数据集通过系统性地整合来自美国人口普查局、劳工统计局、世界卫生组织等62个权威数据源,构建了一个统一格式的无障碍数据集合。该数据集覆盖了人口统计、就业、网络无障碍、辅助技术专利、特殊教育、医疗保健、住房歧视、交通运输及政府福利等多个维度,确保了数据的全面性与一致性,为研究者提供了一个集中且易于使用的数据平台。
特点
该数据集以其广泛的数据覆盖和精细的粒度而著称,不仅囊括了美国县级、州级及国家级的残疾率统计数据,还延伸至全球194个以上的国家,涉及健康指标、政策比较等多个层面。其特点在于数据的时效性与多样性,例如包含了从1976年至2023年的特殊教育学生数据、长达33年的ADA歧视指控记录,以及最新的网络无障碍合规性趋势。此外,数据集以CSV、JSON等多种格式提供,并附有10个Jupyter笔记本,便于用户进行数据加载、基础分析和可视化,极大地提升了数据的可操作性与研究效率。
使用方法
用户可通过Python的pandas和json库直接加载数据集中的文件,例如读取县级残疾率CSV文件或解析JSON格式的长期趋势数据。数据集附带的Jupyter笔记本提供了分类别的分析示例,涵盖人口统计、就业差距、网络无障碍等多个主题,用户可基于这些笔记本进行定制化分析或生成图表。此外,数据集在Hugging Face和Kaggle平台上均有分发,支持便捷的在线访问与集成,使得研究人员能够快速开展跨领域的无障碍研究,深入探索残疾人口的社会经济状况及政策影响。
背景与挑战
背景概述
Accessibility Atlas 数据集由 Luke Steuber 主导构建,旨在系统性地整合全球范围内与残障议题相关的分散数据。该数据集汇集了来自美国人口普查局、世界卫生组织、经济合作与发展组织等数十个权威机构的62个子数据集,覆盖了人口统计、就业状况、网络无障碍、辅助技术专利、特殊教育、医疗保健等多个关键维度。其核心研究问题聚焦于如何通过标准化的数据格式,为残障研究、政策制定与社会倡导提供一个统一、可操作的数据基础设施,从而深化对残障群体社会参与不平等现象的理解与干预。
当前挑战
该数据集致力于解决残障研究领域长期存在的数据碎片化与可及性难题,其核心挑战在于如何从异构、多源且不断更新的官方统计与报告中,提取并整合出具有时空一致性的结构化信息。在构建过程中,面临数据标准化处理的复杂性,例如不同国家与机构在残障定义、统计口径与发布格式上的显著差异;同时,确保大规模数据(如WHO数据集达25MB)在整合后的可管理性与分析效率,以及协调各类数据源(如公共领域与CC协议)的许可兼容性,均是实现数据集稳健性与实用性的关键障碍。
常用场景
经典使用场景
在残障研究与包容性政策分析领域,Accessibility Atlas数据集常被用于揭示残障人口的社会经济状况与系统性障碍。研究者通过整合美国人口普查、劳工统计局及国际组织等多源数据,能够深入分析残障人士在就业、教育、医疗等维度的不平等现象。例如,利用该数据集中的就业差距时间序列与ADA歧视指控记录,学者可以量化残障群体在劳动力市场面临的挑战,并评估反歧视政策的实施效果。这种跨领域、长时序的数据整合为理解残障包容性提供了坚实的实证基础。
实际应用
在公共政策与公共服务设计层面,该数据集为政府与非营利组织提供了精准决策支持。城市规划者借助其中的交通无障碍数据(如ADA辅助客运系统记录)优化残障人士出行服务;教育部门可依据IDEA特殊教育数据集调整资源分配,减少不同残障类别学生的教育差距。同时,企业利用WebAIM百万页面合规性数据与专利记录,能够评估数字产品可访问性并推动辅助技术创新。这些应用直接促进了《联合国残疾人权利公约》倡导的包容性社会建设。
衍生相关工作
基于该数据集衍生的经典研究涵盖多个学科前沿。在计算社会科学中,学者结合VizWiz视觉问答数据开发了面向视障用户的AI辅助系统;公共健康领域的研究利用CDC残障流行率与HALE指标,构建了残障与慢性病关联的地理空间模型。此外,法律学者通过分析EEOC歧视指控与ADA数字诉讼趋势,揭示了政策执行中的司法缺口。这些工作不仅拓展了残障研究的方法论边界,也为跨学科协作树立了典范。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作