five

UK Public Sector AI Deployments Dataset

收藏
github2026-04-05 更新2026-04-24 收录
下载链接:
https://github.com/obielin/uk-public-sector-ai-deployments
下载链接
链接失效反馈
官方服务:
资源简介:
一个经过整理的、研究级别的数据集,涵盖了英国公共部门组织的AI系统部署情况,包括治理状态、监督机制、监管审查和事件历史。

A curated, research-grade dataset covering the deployment of AI systems across UK public sector organizations, including their governance status, oversight mechanisms, regulatory reviews, and incident histories.
创建时间:
2026-03-29
原始信息汇总

🗂️ 英国公共部门人工智能部署数据集

📌 数据集概览

该数据集是一个经过整理的、研究级的数据集,记录了英国公共部门组织中人工智能系统的部署情况,涵盖治理状态、监督机制、监管审查和事件历史。

  • 最新版本:v1.0.0
  • 记录数量:30条
  • 许可证:CC BY 4.0
  • 发布者:Linda Oraegbunam
  • 数据集地址:https://github.com/obielin/uk-public-sector-ai-deployments

🎯 数据集创建目的

英国政府的算法透明度记录标准(ATRS)要求公共机构发布其算法工具的相关信息,但合规性参差不齐,公众对政府人工智能部署的认知分散。该数据集将来自ATRS条目、议会质询、信息专员办公室(ICO)执法记录、信息自由(FOI)回应以及学术文献中的公开信息,整合为一个单一、可引用、结构化的资源。


📊 关键发现(v1.0.0)

发现项 统计数据
处理个人数据的系统 82%
发布数据保护影响评估(DPIA)的系统 14%
拥有ATRS条目的系统 30%
四级(关键风险)系统 40%
平均治理评分 52 / 100
未进行DPIA的四级系统 10个

🏷️ 风险等级分类

等级 标签 示例
1 低风险 洪水建模、统计质量保证
2 中风险 在线法庭、金融申诉服务分流
3 高风险 英国国家医疗服务体系(NHS)恶化警报、住房福利人工智能
4 关键风险 面部识别、羁押风险、签证决策

🚀 快速开始

bash git clone https://github.com/obielin/uk-public-sector-ai-deployments.git cd uk-public-sector-ai-deployments

python scripts/analyse.py python scripts/analyse.py --filter sector=Healthcare python scripts/analyse.py --output summary.md


📖 引用方式

bibtex @dataset{oraegbunam2026uksectorai, author = {Oraegbunam, Linda}, title = {UK Public Sector AI Deployments Dataset}, year = {2026}, version = {1.0.0}, publisher = {GitHub}, url = {https://github.com/obielin/uk-public-sector-ai-deployments}, license = {CC BY 4.0} }


🔗 相关项目

  • aiwatch-skill — 人工智能治理情报的Claude Code技能
  • public-sector-ai-playbook — 英国公共部门人工智能治理模板
  • agentic-alignment-toolkit — 评估智能体对齐的Python工具包
搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能治理领域,英国公共部门AI部署的透明度与合规性问题日益凸显。为系统性地整合碎片化信息,该数据集以英国政府算法透明度记录标准(ATRS)为核心框架,广泛采集来自ATRS条目、议会质询、信息专员办公室执法记录、信息自由法回应及学术文献等多源异构数据,经过结构化清洗与标准化处理后,形成一份精炼且可引用的科研级数据集。当前版本(v1.0.0)收录了30个经核实的AI系统部署案例。
特点
该数据集的一大特色在于其多维度的治理标注体系。每个部署记录不仅涵盖系统名称、所属公共部门及功能描述,还包含了风险等级分类(从低风险的洪水建模到高风险的签证决策共四个层级)、治理评分(满分为100分,平均得分为52分)、数据保护影响评估(DPIA)发布状态及算法透明度记录(ATRS)注册情况等关键指标。数据显示,82%的系统涉及个人数据处理,但仅14%发布了DPIA,40%的系统被列为最高风险等级(第四级),深刻揭示了当前治理框架下的显著缺口。
使用方法
研究人员与政策分析者可通过GitHub仓库直接克隆数据集,并利用随附的Python分析脚本快速开展探索性工作。基础命令'python scripts/analyse.py'即可生成整体统计报告,而添加'--filter sector=Healthcare'参数则可按公共部门领域(如医疗健康)进行针对性过滤分析。输出格式支持Markdown摘要,便于整合到研究报告或政策文档中。数据集采用CC BY 4.0许可协议,便于学术引用与二次传播。
背景与挑战
背景概述
在人工智能系统快速渗透公共治理领域的背景下,英国政府虽推出了算法透明度记录标准(ATRS),但各公共机构对其算法工具的披露存在显著不一致性,导致公众对政府AI部署的认知呈碎片化状态。为此,Linda Oraegbunam于2026年创建了UK Public Sector AI Deployments Dataset,旨在整合分散于ATRS登记、议会质询、信息专员办公室执法记录、信息自由请求以及学术文献中的信息,形成一份可引用、结构化的研究级数据集。该数据集首次系统性地收录了30项英国公共部门AI系统部署实例,涵盖从洪水建模到面部识别等不同风险等级的应用,为评估公共部门AI治理现状提供了关键数据基础,对推动算法透明与问责研究具有重要影响力。
当前挑战
该数据集面临的挑战主要来自两个层面。在领域问题层面,核心挑战在于公共部门AI系统的治理透明度严重不足——尽管82%的系统处理个人数据,但仅有14%发布了数据保护影响评估(DPIA),30%拥有ATRS登记,且40%处于最高风险等级(Tier 4)的系统中有10项缺乏DPIA,反映出机制执行与法规遵从之间的显著鸿沟。在构建过程中,研究者需从ATRS、议会记录、监管文件及学术论文等多源异构信息中手动提取与交叉验证,确保30项部署的数据准确性,同时应对信息披露不完整、格式不统一等障碍,这对数据集的完整性、时效性和可复现性构成了持续性挑战。
常用场景
经典使用场景
UK Public Sector AI Deployments Dataset 为研究英国公共部门人工智能系统治理现状提供了系统化的数据基础。该数据集整合了算法透明记录标准(ATRS)条目、议会质询、信息专员办公室(ICO)执法记录、信息自由法(FOI)回应以及学术文献中的公开信息,收录了30个AI部署案例。研究者可借此分析不同风险等级系统的治理分数、数据保护影响评估(DPIA)完成情况以及监管审查历史,进而评估公共部门AI治理的合规性与成熟度。该数据集特别适用于定量比较各类机构在算法透明度、问责机制和风险管理上的差异,为政策制定者优化监管框架提供实证依据。
实际应用
在实际应用中,该数据集可直接服务于英国公共部门的AI治理审计与合规改进工作。政府机构可使用其指标评估内部系统是否达到ATRS要求,识别缺乏DPIA或监管不足的高风险部署。政策分析者能借助风险层级分类和治理分数,优先审查疑似面临关键风险的政务AI,如面部识别或签证决策系统。此外,数据集为信息专员办公室等监管机构提供了系统化的执法优先级参考,辅助发现合规漏洞集中的领域。数据集还支持媒体与民间组织开展透明度调查,增强公众对政府AI使用的问责能力,最终推动形成更健全的公共部门AI治理生态。
衍生相关工作
该数据集已催生一系列衍生工作,深化了其在AI治理领域的应用价值。其中,aiwatch-skill项目将数据集转化为Claude Code技能,用于智能体驱动的治理情报分析;public-sector-ai-playbook项目则基于数据集洞察开发了适用于英国公共部门AI的治理模板与操作指南;agentic-alignment-toolkit提供了Python工具包,可用于评估自主系统的对齐性。此外,数据集还引发了针对风险层级分类标准优化、跨部门治理分数比较等学术探索,为后续研究机构开展大规模治理有效性评估和监管工具创新奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作