five

accessibility-atlas

收藏
Hugging Face2026-02-14 更新2026-02-15 收录
下载链接:
https://huggingface.co/datasets/lukeslp/accessibility-atlas
下载链接
链接失效反馈
官方服务:
资源简介:
Accessibility Atlas 是一个涵盖残疾人口统计、就业差距、网络无障碍合规性等多个领域的综合数据集集合,包含42个数据集,覆盖15个类别。该数据集旨在为研究人员、记者、政策分析师及为残疾社区开发工具的人员提供支持。数据集内容主要包括美国残疾人口统计(来自人口普查局)、残疾就业数据、特殊教育数据、网络无障碍数据、国际残疾数据、政府福利数据、医疗与心理健康数据、住房与交通数据、辅助技术专利数据以及视觉无障碍数据等。数据集规模从10K到100K不等,数据格式包括JSON、CSV和Excel。数据集来源多样,包括美国政府部门(公共领域数据)和国际组织(开放许可数据)。此外,数据集附带了10个Jupyter笔记本,用于数据加载、分析和可视化。
创建时间:
2026-02-09
原始信息汇总

Accessibility Atlas 数据集概述

数据集基本信息

  • 数据集名称:Accessibility Atlas
  • 数据集地址:https://huggingface.co/datasets/lukeslp/accessibility-atlas
  • 许可证:混合许可证(MIT License for the collection,各子数据集有其独立许可证)
  • 任务类别:表格分类、特征提取
  • 语言:英语
  • 数据规模:10K<n<100K
  • 标签:无障碍、残疾、WCAG、就业、人口普查、WHO、辅助技术、特殊教育、屏幕阅读器、健康、人口统计、网络无障碍

数据集内容

数据集包含42个子数据集,涵盖15个类别。

美国残疾人口统计(人口普查局)

  • 包含8个来自美国社区调查的数据集。
  • 涵盖县级、州级和国家级的残疾率。
  • 县级数据:3100多个县(ACS 5-Year 2022)。
  • 州级数据:50个州及华盛顿特区(ACS 5-Year 2021)。
  • 国家趋势:13年趋势(从11.9%到13.6%)。
  • 人口统计:按种族、年龄、性别和6种残疾类型划分。

残疾与就业

  • 包含4个关于就业差距、歧视投诉和工作场所便利设施的数据集。
  • 劳工统计局按残疾状况划分的就业/失业数据。
  • FRED 16年时间序列数据(差距从40个百分点缩小至37个百分点)。
  • 679,637项ADA歧视投诉(1992-2024年)。
  • JAN便利设施成本数据(58.7%成本为0美元)。

特殊教育(IDEA)

  • 包含6个来自国家教育统计中心的数据集,涉及IDEA B部分服务的750万学生。
  • 涵盖13个残疾类别。
  • 涵盖51个州。
  • 1976-2023年历史数据。
  • 人口统计、环境、州级细分数据。

网络无障碍

  • 包含5个关于WCAG合规性、诉讼、屏幕阅读器使用情况和第508节的数据集。
  • WebAIM百万:94.8%的Top 100万网页未通过WCAG。
  • 屏幕阅读器调查:1,539名受访者。
  • ADA数字诉讼:从814起(2017年)增至约4,000起(2024年)。
  • 第508节:245个联邦实体,仅23%符合。
  • HTTP Archive无障碍趋势2019-2024。

国际残疾数据

  • 包含8个涵盖194多个国家的数据集。
  • WHO:残疾流行率、DALYs/YLDs、健康预期寿命。
  • OECD:34个国家,流行率/就业/支出。
  • Eurostat:36个欧盟国家。
  • 世界银行:10个社会经济指标。
  • 联合国CRPD:199个国家的批准状态。

政府福利

  • SSA:SSDI/SSI年度数据(730万 + 490万受益人)。
  • VA:按州划分的残疾补偿(570万以上退伍军人)。

医疗保健与心理健康

  • CMS:医疗补助残疾登记(1,020万登记人)。
  • SAMHSA:心理健康流行率2008-2023。

住房、交通、教育

  • HUD:公平住房投诉(残疾是首要原因,约55%)。
  • NTD:辅助客运系统乘车次数/成本(40-50美元/次)。
  • CRDC:第504节、约束/隔离、纪律。

辅助技术专利

  • WIPO:专利数据1985-2026(从10项增至519项专利)。

视觉无障碍

  • VizWiz:来自盲人用户的4,319个VQA对(CC BY 4.0)。

关键发现

  • 4,410万美国人(13.4%)有残疾(2022年人口普查)。比率从11.9%(2010年)上升至13.6%(2023年)。行动不便(6.7%)和认知障碍(5.7%)最为常见。
  • 就业差距巨大。残疾人的劳动力参与率为24.5%,非残疾人约为67%。OECD平均差距:34个百分点。
  • 工作场所便利设施成本低廉。58.7%成本为零。中位数:300美元。但自1992年以来已提交679,637项ADA投诉。
  • 网络仍然存在问题。94.8%的Top 100万网站未通过WCAG。平均每页51个错误。
  • 残疾是公平住房投诉的首要原因(约占所有HUD投诉的55%)。
  • 特殊教育正在增长。目前15.2%的公立学校学生接受IDEA服务。自2000年以来,自闭症增长了8.5倍。
  • 全球有13亿人(16%)患有严重残疾(WHO)。190个国家签署了联合国CRPD。

笔记本

  • 包含10个Jupyter笔记本,位于notebooks/目录下,用于加载数据、运行分析和生成图表。
  • 涵盖主题:人口普查残疾人口统计、残疾就业、网络无障碍、国际残疾数据、特殊教育IDEA、政府福利、医疗保健与心理健康、住房交通教育、辅助技术、手语视觉AAC。
  • 根目录下提供accessibility_atlas_demo.ipynb作为快速入门示例。

数据来源与许可证

  • 大部分数据来自美国政府(公共领域)和国际组织(开放许可证)。
  • 各子数据集有其独立许可证,包括公共领域、CC BY-NC-SA 3.0 IGO、CC BY 4.0等。

文件格式

  • 数据文件:JSON、CSV、Excel(XLSX)。
  • 笔记本:Jupyter(.ipynb)。

关于与引用

  • 数据集为Data Trove集合的一部分。
  • 创建者:Luke Steuber。
  • 提供BibTeX引用格式。
搜集汇总
数据集介绍
main_image_url
构建方式
在无障碍研究领域,数据分散于众多政府机构与国际组织,构建一个统一的数据集具有重要价值。Accessibility Atlas通过系统整合来自美国人口普查局、劳工统计局、教育部等15个类别的42个公开数据集,涵盖残障人口统计、就业差距、网络无障碍合规性等多个维度。数据集采用自动化脚本进行数据清洗与格式标准化,确保JSON、CSV和Excel文件的结构一致性,并附有10个Jupyter笔记本提供分析示例,从而为研究者提供可直接使用的结构化资源。
特点
该数据集的核心特点在于其跨领域与跨层级的综合性,不仅覆盖美国县级至国家级的残障人口统计数据,还纳入国际组织如WHO、OECD的全球性指标。数据时间跨度广泛,例如就业数据包含16年时间序列,特殊教育数据追溯至1976年,从而支持纵向趋势分析。此外,数据集突出实用性,例如整合了网络无障碍合规性检测结果(如WebAIM百万元页分析)与辅助技术专利数据,为政策制定与技术开发提供实证基础。
使用方法
研究人员可通过数据集附带的Jupyter笔记本快速开展分析,例如利用`census_disability_demographics.ipynb`生成残障率地理分布图,或通过`web_accessibility.ipynb`追踪WCAG合规趋势。数据文件支持多种格式,用户可根据需要直接加载CSV或JSON进行统计建模。鉴于数据来源涉及多元许可协议,使用时应遵循相应条款,如WHO数据采用CC BY-NC-SA 3.0 IGO许可,而美国政府数据多为公共领域资源,可自由用于学术或政策分析。
背景与挑战
背景概述
Accessibility Atlas数据集由Luke Steuber于2026年创建,旨在整合全球范围内分散的无障碍与残障相关数据。该数据集汇集了来自美国人口普查局、劳工统计局、世界卫生组织等权威机构的42个子数据集,涵盖残障人口统计、就业差距、网络无障碍合规、辅助技术专利等15个核心类别。其核心研究问题聚焦于通过系统化数据聚合,揭示残障群体在社会经济、教育、医疗及数字接入等多维度的现状与挑战,为政策制定者、研究人员及倡导者提供实证基础,推动包容性社会设计与技术发展。
当前挑战
该数据集致力于解决残障研究领域长期存在的数据碎片化与可及性不足问题,其构建面临多重挑战。在领域层面,残障数据的跨机构、跨国别标准化整合极为复杂,需协调不同数据源的定义差异与统计口径。构建过程中,原始数据分散于数十个政府机构与国际组织,涉及混合许可协议(如公共领域与CC BY-NC-SA),需进行繁琐的格式统一与法律合规处理。此外,网络无障碍等动态领域的数据更新频繁,要求持续维护以保持时效性,而特殊教育等历史数据的长期趋势分析亦需应对统计方法变迁带来的可比性难题。
常用场景
经典使用场景
在无障碍研究领域,Accessibility Atlas数据集为学者和政策制定者提供了跨领域整合的实证基础。该数据集经典应用于分析残疾人口的社会经济状况,例如通过美国社区调查数据追踪残疾率的历史趋势,或利用就业差距数据集评估劳动力市场中的包容性水平。研究人员常借助其结构化的表格分类特征,构建统计模型以揭示残疾群体在教育、就业和医疗等方面的系统性差异,为跨学科比较研究奠定数据基石。
解决学术问题
该数据集有效解决了无障碍研究中数据分散且标准不一的学术难题。通过整合来自人口普查、劳工统计、教育记录及国际组织的多源数据,它使学者能够系统探究残疾与就业歧视、网络可访问性合规性、特殊教育资源配置等核心议题。其意义在于提供了纵向与横向可比的数据框架,支持对残疾包容政策的效应评估,推动了社会科学与公共健康研究在方法论上的融合与创新。
衍生相关工作
基于该数据集衍生的经典工作主要集中在数据驱动型政策研究与无障碍技术评估领域。例如,学者利用其就业差距时间序列分析了《美国残疾人法案》的长期影响,或结合网络可访问性数据开发自动化合规检测工具。在国际比较方面,研究团队整合WHO与OECD指标,构建了全球残疾包容指数。这些工作不仅拓展了数据集的学术边界,也为全球无障碍倡导提供了量化依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作