outage.fyi

github2026-03-12 更新2026-03-19 收录

下载链接：

https://github.com/buckeyevn/Outage.fyi

下载链接

链接失效反馈

官方服务：

资源简介：

outage.fyi 收集、标准化并评分每个云提供商的公开状态页面、事件报告和停机事件，提供可查询的实际可靠性数据，而非营销页面。

outage.fyi collects, standardizes, and scores public status pages, incident reports, and outage events from all cloud providers, delivering queryable, factual reliability data rather than content from their marketing pages.

创建时间：

2026-03-12

原始信息汇总

outage.fyi 数据集概述

数据集简介

outage.fyi 是一个收集、标准化并评估各类云服务、SaaS工具和API公开状态页面、事件报告和停机事件的数据集。其目标是通过真实事件数据提供可查询的实际可靠性指标，而非依赖营销宣传页面。

数据收集与处理流程

数据来源

从数百个公开状态页面定期抓取数据。

处理流程

抓取：通过特定适配器抓取各提供商当前及历史事件。
标准化：将原始事件数据转换为统一的标准格式记录。
评分：基于标准化事件数据计算可靠性指标。
存储：数据存储在本地SQLite数据库中。
服务：通过HTTP API提供数据查询。

数据标准化格式

每个事件被标准化为包含以下字段的记录：

provider: 提供商标识
id: 事件唯一标识
title: 事件标题
status: 事件状态
severity: 严重程度
components: 受影响的组件
startedAt: 开始时间
resolvedAt: 解决时间
durationMinutes: 持续时间
updates: 状态更新记录

覆盖的提供商类别

类别	提供商示例
云服务	AWS, GCP, Azure, DigitalOcean, Hetzner, OVH
托管服务	Vercel, Netlify, Cloudflare, Fly.io, Railway, Render
数据库	PlanetScale, Supabase, Neon, MongoDB Atlas, Redis Cloud
身份验证	Auth0, Clerk, Firebase Auth, Supabase Auth
支付	Stripe, Braintree, Square
消息服务	Twilio, SendGrid, Postmark, Resend
监控	Datadog, New Relic, Sentry, PagerDuty
开发工具	GitHub, GitLab, Bitbucket, npm, Docker Hub
AI/ML	OpenAI, Anthropic, Replicate, Hugging Face

可靠性评分指标

评分基于可配置的时间窗口（7天、30天、90天、1年）内的真实事件数据计算，指标包括：

正常运行时间百分比：基于事件持续时间与总时间的实际可用性。
平均解决时间：所有事件的平均解决时间。
事件频率：故障发生频率。
严重程度分布：重大/次要/维护事件的比率。
响应速度：从事件开始到首次状态更新的时间。

数据访问方式

API接口

GET /v1/providers：列出所有被追踪的提供商。
GET /v1/providers/:id：获取提供商详情及当前状态。
GET /v1/incidents：列出事件（可过滤）。
GET /v1/score/:provider：获取提供商可靠性评分。
GET /v1/compare：比较两个提供商。
GET /v1/timeline/:provider：获取提供商事件时间线。
GET /v1/status：获取所有提供商的当前状态。
GET /v1/health：API健康检查。

命令行工具

提供用于数据抓取、服务器启动、评分重算和数据导出的命令行工具。

项目结构

项目主要包含以下核心模块：

bin/：命令行工具入口点。
src/lib/scrapers/：提供商抓取适配器。
src/lib/normalizer/：数据标准化模块。
src/lib/scoring/：可靠性评分计算引擎。
src/lib/storage/：数据持久化（SQLite）。
src/api/：HTTP API服务器和路由处理器。
data/providers/：提供商注册表。

搜集汇总

数据集介绍

构建方式

在云计算服务可靠性评估领域，outage.fyi数据集通过系统化的网络爬取与数据标准化流程构建而成。该数据集采用定时爬虫机制，自动抓取数百家云服务提供商、SaaS工具及API的公开状态页面与事件报告，覆盖了从基础设施到应用层的多元化服务。原始数据经过专门设计的解析器适配不同状态页面平台，随后通过规范化模块将异构事件记录转换为统一的结构化格式，最终存储于本地SQLite数据库，并支持通过API接口进行高效查询与历史回溯。

特点

该数据集的核心特点在于其全面性与标准化程度，不仅聚合了跨云生态系统的实时与历史故障事件，还基于实际事件数据计算可靠性指标，如真实可用性百分比、平均修复时间及事件频率分布。数据模式采用严谨的类型定义，确保每一条事件记录均包含服务商标识、事件严重程度、影响组件及时间戳等关键字段，从而支持多维度的对比分析与趋势研究。此外，数据集通过模块化设计允许灵活扩展新的服务提供商，并提供了可配置的时间窗口以动态评估服务可靠性。

使用方法

用户可通过命令行工具或HTTP API两种方式使用该数据集，实现数据抓取、查询与分析的一体化操作。通过运行内置的爬虫脚本，可执行单次或持续的数据采集任务，并支持按服务商筛选与历史数据回填。API接口提供了丰富的查询端点，允许用户获取特定服务商的可靠性评分、按时间范围过滤事件列表，以及进行跨服务商的可用性对比。数据集还支持导出为JSON或CSV格式，便于进一步的数据处理与可视化应用。

背景与挑战

背景概述

在云计算与软件即服务（SaaS）领域，服务可靠性是衡量提供商性能的核心指标，然而公开的可用性数据往往缺乏标准化与透明度。outage.fyi数据集应运而生，由开源社区主导构建，旨在通过系统化爬取、归一化处理与评分机制，整合数百家云服务提供商、SaaS工具及API的公开状态页面与事件报告。该数据集聚焦于真实运行时间数据的收集与分析，摒弃营销宣传中的模糊承诺，为研究人员与从业者提供可查询、可比较的历史中断事件记录与可靠性评分，从而推动云服务生态的透明度与问责机制发展。

当前挑战

outage.fyi数据集致力于解决云服务可靠性评估中的核心挑战：如何从异构、非结构化的状态页面中提取标准化中断信息，并基于真实事件数据计算一致性指标。构建过程中面临多重技术难题，包括适配多样化的状态页面平台（如Atlassian Statuspage、Instatus等），设计通用数据模式以归一化不同格式的事件描述；同时，需确保爬取过程的稳定性与时效性，处理动态内容更新与反爬机制，并维护历史数据的完整性与准确性。此外，评分引擎需平衡多维度指标（如实际可用性百分比、平均修复时间、事件频率与严重性分布），以提供全面且可解释的可靠性评估。

常用场景

经典使用场景

在云计算与软件即服务（SaaS）领域，服务可靠性是衡量技术基础设施稳定性的核心指标。outage.fyi数据集通过系统化爬取、标准化处理数百家云服务提供商的状态页面与事件报告，构建了一个涵盖历史中断事件的统一数据库。该数据集最经典的使用场景在于为研究人员和工程师提供基于真实事件的服务可用性分析，支持跨时间窗口的可靠性评分计算，例如通过查询特定服务在90天内的实际运行时间百分比与平均修复时间，从而客观评估其服务等级协议（SLA）的履行情况。

实际应用

在实际运维与决策支持层面，outage.fyi数据集为技术团队提供了关键的工具性价值。开发者和系统架构师可借助其API接口实时查询或比较不同云服务的中断历史与可靠性指标，从而为技术选型、灾备策略制定及供应商风险评估提供数据驱动依据。例如，在构建多云架构时，团队可通过对比AWS、GCP等主流平台在特定时间窗口内的故障频率与严重程度分布，优化服务部署方案，提升整体系统的容错能力与业务连续性。

衍生相关工作

基于outage.fyi数据集所构建的标准化中断事件库，已衍生出一系列聚焦云服务可靠性的经典研究工作。例如，有学者利用该数据集的时间序列特性，开发了基于机器学习的服务中断预测模型，通过分析历史事件的时空模式来预警潜在故障。同时，该数据也被用于构建跨提供商的服务依赖图谱研究，揭示大规模云服务中断的级联效应，为弹性系统设计提供了新的方法论基础，显著丰富了云计算可靠性领域的学术成果与实践工具。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集