outage.fyi
收藏github2026-03-12 更新2026-03-20 收录
下载链接:
https://github.com/buckeyee/Outage.fyi
下载链接
链接失效反馈官方服务:
资源简介:
outage.fyi是一个关于云服务、SaaS工具和API的公开状态页面、事件报告和停机事件的实时正常运行时间数据集。它通过爬取数百个状态页面,将事件标准化为通用模式,并根据真实数据计算可靠性评分,从而提供一个可搜索、可查询的数据集,记录云生态系统中的每一次停机事件。
outage.fyi is a real-time uptime dataset focused on public status pages, incident reports, and outage incidents for cloud services, SaaS tools, and APIs. It crawls hundreds of status pages, standardizes incidents into a universal schema, calculates reliability scores using real-world data, and thereby provides a searchable and queryable dataset that records every outage incident across the cloud ecosystem.
创建时间:
2026-03-12
原始信息汇总
outage.fyi 数据集概述
数据集简介
outage.fyi 是一个收集、标准化并评估各类云服务、SaaS工具和API公共状态页、事件报告和停机事件的真实运行时间数据集。其目标是提供基于实际事件的可查询可靠性数据,而非营销页面宣称的数据。
数据来源与处理流程
数据通过爬取数百个状态页获得,并遵循标准化的处理流程。
数据采集
- 来源:数百个云服务提供商的状态页面。
- 方式:每个提供商对应一个爬虫适配器,系统会自动检测状态页平台(如 Atlassian Statuspage, Instatus, Cachet 或自定义平台)并使用相应的解析器。不存储原始HTML,只保留标准化后的事件数据。
数据标准化
所有事件被转换为以下标准记录格式: typescript { provider: "vercel", id: "inc-2026-03-08-deploy", title: "Elevated error rates on deployments", status: "resolved", severity: "major", components: ["deployments", "edge-network"], startedAt: "2026-03-08T14:22:00Z", resolvedAt: "2026-03-08T15:47:00Z", durationMinutes: 85, updates: [ ... ] }
可靠性评分
基于可配置时间窗口(7天、30天、90天、1年)内的真实事件数据计算可靠性分数,指标包括:
- 正常运行时间百分比:基于事件持续时间与总时间的实际可用性。
- 平均解决时间:所有事件的平均解决时间。
- 事件频率:故障发生频率。
- 严重性分布:重大/次要/维护事件的比率。
- 响应速度:从事件开始到首次状态更新的时间。
数据覆盖范围
数据集默认包含多个类别的主要提供商,添加新提供商仅需添加一个文件。
| 类别 | 提供商示例 |
|---|---|
| 云服务 | AWS, GCP, Azure, DigitalOcean, Hetzner, OVH |
| 托管服务 | Vercel, Netlify, Cloudflare, Fly.io, Railway, Render |
| 数据库 | PlanetScale, Supabase, Neon, MongoDB Atlas, Redis Cloud |
| 身份验证 | Auth0, Clerk, Firebase Auth, Supabase Auth |
| 支付 | Stripe, Braintree, Square |
| 消息服务 | Twilio, SendGrid, Postmark, Resend |
| 监控 | Datadog, New Relic, Sentry, PagerDuty |
| 开发工具 | GitHub, GitLab, Bitbucket, npm, Docker Hub |
| AI/ML | OpenAI, Anthropic, Replicate, Hugging Face |
数据访问与查询
数据可通过本地API进行查询,主要端点如下:
API端点
GET /v1/providers:列出所有被跟踪的提供商。GET /v1/providers/:id:获取提供商详情及当前状态。GET /v1/incidents:列出事件(可过滤),过滤参数包括提供商、严重性、起止日期、受影响组件、分页等。GET /v1/score/:provider:获取特定提供商的可靠性分数,可指定时间窗口。GET /v1/compare:比较两个提供商,需指定提供商标识符和时间窗口。GET /v1/timeline/:provider:获取提供商的事件时间线,可指定起始日期和粒度。GET /v1/status:获取所有提供商的当前状态。GET /v1/health:API健康检查。
命令行工具
数据集提供命令行工具用于数据抓取、服务启动和数据处理:
- 抓取:可一次性抓取所有提供商、抓取单个提供商、以守护进程模式持续运行或回填历史数据。
- 服务器:启动API服务器。
- 工具:重新计算分数、导出完整数据集(支持JSON和CSV格式)。
项目结构
核心代码与数据组织如下:
bin/:包含爬虫CLI、API服务器入口、分数重计算和数据集导出的脚本。src/lib/scrapers/:包含提供商爬虫适配器、注册表及各类状态页平台适配器。src/lib/normalizer/:包含数据标准化逻辑。src/lib/scoring/:包含可靠性分数计算引擎。src/lib/storage/:包含SQLite持久化逻辑。src/api/:包含HTTP服务器和API路由处理器。data/providers/:包含提供商注册表文件。
数据存储
- 存储方式:数据本地存储在SQLite数据库中。
- 数据库路径:可通过环境变量
OUTAGE_DB_PATH配置。
环境配置
可通过环境变量进行配置,例如数据库路径、抓取间隔、日志级别、API端口和爬虫用户代理。
搜集汇总
数据集介绍

构建方式
在云计算服务可靠性监测领域,outage.fyi数据集通过系统化的网络爬取与数据标准化流程构建而成。该数据集定期抓取数百个云服务提供商、SaaS工具及API的公开状态页面与事件报告,利用针对不同状态页平台(如Atlassian Statuspage、Instatus等)的适配器解析原始数据,随后通过规范化引擎将异构事件记录转换为统一的结构化格式,最终存储于本地SQLite数据库并计算多维可靠性指标。
使用方法
用户可通过命令行工具启动数据抓取、API服务或批量导出功能,亦可通过RESTful API接口直接查询事件记录与可靠性评分。数据集支持按服务商、严重程度、时间范围及受影响组件进行筛选,并提供多时间粒度的事件时间线查询与跨服务商对比接口。开发者可通过编写适配器便捷地扩展监测范围,整个系统支持本地部署与定制化调度,便于集成至第三方监控或分析平台中。
背景与挑战
背景概述
在云计算与软件即服务(SaaS)领域,服务可用性与可靠性是衡量服务质量的核心指标,然而各提供商公开的运营数据往往缺乏透明度与一致性,使得用户难以基于实际历史表现做出客观评估。outage.fyi数据集应运而生,由开发者社区主导构建,旨在通过系统化爬取、规范化处理与量化评分,整合数百家云服务提供商、SaaS工具及API的公开状态页面与事件报告,形成可查询的历史中断事件数据库。该数据集以实际运行数据为基础,计算包括正常运行时间百分比、平均修复时间、事件频率及严重性分布在内的多维可靠性指标,为研究云计算生态系统中的服务韧性、故障模式及行业基准提供了实证基础,推动了运维透明度与数据驱动决策的发展。
当前挑战
outage.fyi数据集致力于解决云服务可靠性评估中的核心挑战:如何从异构、非结构化的公开状态信息中提取标准化、可比较的中断事件数据,以对抗行业普遍存在的营销宣传与真实运行表现之间的信息不对称。在构建过程中,面临多重技术挑战:首先,需开发适配不同状态页面平台(如Atlassian Statuspage、Instatus及自定义系统)的爬虫解析器,以应对多样化的数据格式与更新机制;其次,事件数据的规范化处理要求设计统一模式,将原始报告映射为包含事件标识、严重程度、时间戳及影响组件等字段的结构化记录,确保跨提供商的一致性;此外,可靠性评分引擎需基于动态时间窗口计算复合指标,并处理历史数据回溯与实时更新的平衡,以维持数据集的时效性与准确性。
常用场景
经典使用场景
在云计算与软件即服务(SaaS)领域,服务可靠性是评估供应商性能的核心指标。outage.fyi数据集通过系统化爬取、归一化处理并评分各类云服务商、SaaS工具及API的公开状态页面与事件报告,构建了一个覆盖广泛、历史可追溯的可靠性数据库。其经典使用场景在于为研究人员与工程师提供基于真实事件数据的服务可用性分析,支持跨时间窗口的故障模式识别与供应商性能对比,从而超越营销宣传,揭示实际运行状况。
解决学术问题
该数据集有效解决了云计算研究中服务可靠性量化与验证的难题。传统上,供应商自我报告的可用性数据往往缺乏独立验证,而outage.fyi通过自动化采集真实故障事件,提供了标准化的时间序列数据,支持对平均修复时间(MTTR)、故障频率及严重性分布等关键指标的实证分析。这为学术界研究分布式系统韧性、故障传播机制及服务等级协议(SLA)的合规性评估提供了可靠的数据基础,推动了云服务可靠性研究的客观化与精细化。
实际应用
在实际应用层面,outage.fyi数据集为技术决策者与运维团队提供了关键参考。企业可依据该数据集的历史故障记录与可靠性评分,优化供应商选择策略,设计更具韧性的多云架构。开发团队能够利用其API接口实时监控依赖服务的状态,快速定位故障根源,从而缩短系统恢复时间。此外,该数据集还可用于构建自动化告警系统或集成至监控平台,提升整体运维效率与业务连续性保障能力。
数据集最近研究
最新研究方向
在云计算与分布式系统领域,服务可靠性已成为衡量技术基础设施成熟度的核心指标。outage.fyi数据集通过自动化爬取与标准化处理,构建了涵盖数百家云服务商实时与历史故障事件的统一知识库,为学术界与工业界提供了前所未有的实证研究基础。当前前沿研究聚焦于利用该数据集进行跨平台可靠性对比分析,探索故障传播模型在复杂云生态系统中的动力学特征,并开发基于机器学习的异常检测与预测框架。这些研究不仅响应了近年来频繁发生的全球性云服务中断事件所引发的行业关切,也为构建下一代高可用性架构与智能运维体系提供了关键数据支撑,深刻影响着云服务选型、风险评估及容灾策略的制定。
以上内容由遇见数据集搜集并总结生成



