ATLAS (All The Locations of All Servers)
收藏github2025-10-13 更新2025-10-14 收录
下载链接:
https://github.com/Ringmast4r/ATLAS
下载链接
链接失效反馈官方服务:
资源简介:
ATLAS是一个全面的全球数据中心情报系统,映射世界关键基础设施。数据集包含6,266个已验证的数据中心位置,覆盖155个国家,由2,508家公司运营,代表有史以来最全面的开源数据中心位置数据库之一。
ATLAS is a comprehensive global data center intelligence system that maps critical infrastructure worldwide. The dataset contains 6,266 verified data center locations, spanning 155 countries and operated by 2,508 companies, representing one of the most comprehensive open-source data center location databases ever compiled.
创建时间:
2025-10-05
原始信息汇总
ATLAS 数据集概述
数据集基本信息
- 项目名称: ATLAS (All The Locations of All Servers)
- 项目类型: 全球数据中心情报系统
- 数据规模: 6,266个已验证的数据中心位置
- 覆盖范围: 155个国家,2,508家公司
- 数据来源: 开源情报收集
核心数据内容
数据字段
- 设施名称和运营商
- 物理地址
- 地理坐标
- 基础设施分类
- 行政区域信息
数据格式支持
- CSV格式 (
datacenters_processed.csv) - JSON格式 (
datacenters.json) - GeoJSON格式 (用于GIS工具)
数据质量
- 坐标精度: 70.4%设施具有精确坐标 (4,412个设施)
- 地址完整性: 通过智能地址解析改善73%的国家字段缺失问题
- 坐标验证: 纬度范围-90到90,经度范围-180到180
地理分布
区域分布
- 北美: 2,265个设施 (36.1%)
- 欧洲: 1,778+个设施 (28.4%)
- 亚太: 783+个设施 (12.5%)
- 非洲: 179+个设施 (2.9%)
- 南美: 183+个设施 (2.9%)
- 中东: 86+个设施 (1.4%)
主要国家
- 美国: 2,070个设施 (33%)
- 英国: 461个设施
- 荷兰: 296个设施
- 法国: 261个设施
- 德国: 242个设施
技术特性
数据处理
- 自动化数据清洗脚本
- 批量地理编码 (使用OpenStreetMap Nominatim API)
- 坐标验证和错误修正
- 国家别名系统支持
数据文件
datacenters_cleaned.json: 优化数据集,包含国家和州提取datacenters_processed.csv: 处理后的数据集,包含解析的地址字段datacenters_original_scraped.csv: 原始爬取数据
使用限制
- 保留所有权利
- 未经作者明确书面许可,不得使用、复制、修改或分发
搜集汇总
数据集介绍

构建方式
在关键基础设施测绘领域,ATLAS数据集通过开源情报收集技术构建而成。该系统采用自动化网络爬虫从公开渠道采集全球数据中心的地理位置信息,涵盖设施名称、运营商、物理地址和经纬度坐标等关键字段。数据清洗流程包含智能地址解析算法,运用包含200余个国家别名的词典系统进行标准化处理,并基于OpenStreetMap Nominatim API对3973个设施进行批量地理编码,使坐标精度从城市级提升至街道级,成功将坐标覆盖率从36.6%提升至70.4%。
特点
该数据集囊括155个国家的6266个已验证数据中心,涉及2508家运营商,构成当前最全面的开源数据中心位置数据库。其核心特征体现在多层次数据质量优化:通过ZIP编码地理编码补全1434条美国州级信息,修正261个南半球设施的纬度坐标误差,并建立坐标验证机制确保经纬度值处于有效区间。数据架构支持CSV/JSON/GeoJSON多格式输出,包含行政区域划分、地址结构解析等标准化字段,为空间分析提供完整的数据基础。
使用方法
通过Cloudflare Workers构建的RESTful API接口,用户可经由/api/search等端点实现全局检索与条件过滤。交互式地图系统集成五大主题可视化,支持半径搜索、距离测算和邻近分析等空间操作。数据导出功能支持带元数据的高分辨率截图输出,并配备实时统计仪表盘展示国家分布、运营商排名等维度指标。开发者可通过Python或JavaScript调用结构化数据,实现按国家、城市、运营商等属性的多维度检索与空间分析。
背景与挑战
背景概述
ATLAS数据集作为全球数据中心智能测绘系统的代表,由商业地理空间情报平台于近年开发,旨在通过开源情报技术系统性地发现、验证并提取全球数据中心设施的GPS坐标。该项目汇集了来自155个国家的6,266个已验证数据中心位置,涵盖2,508家运营商,构建了互联网关键基础设施的地理分布图谱。其核心研究问题聚焦于全球数据中心空间定位的精确测绘与动态更新,为网络拓扑分析、基础设施风险评估及位置智能服务提供了数据支撑,显著推动了数字地理学与关键基础设施保护领域的交叉研究进展。
当前挑战
在解决数据中心地理定位领域问题时,ATLAS面临数据完整性挑战,包括原始数据中15.5%条目缺失国家字段、83.5%美国条目缺乏州级信息,以及仅36.6%设施具备城市级精确坐标的精度缺陷。构建过程中遭遇多重技术障碍:需通过智能地址解析与邮政编码地理编码修复大量缺失字段,采用OpenStreetMap Nominatim API进行批量地理编码时受限于53%的成功率及坐标符号错误等数据质量问题,同时还需在遵守API速率限制前提下实现全球155个国家数据中心的坐标验证与标准化处理。
常用场景
经典使用场景
在数字基础设施研究领域,ATLAS数据集作为全球数据中心地理分布的权威参考,为网络拓扑分析与基础设施规划提供了关键支撑。该数据集通过整合全球155个国家的6266个数据中心坐标信息,使研究人员能够精确绘制互联网骨干节点的空间分布图谱,进而揭示数字基础设施的全球布局规律与区域集中特性。
解决学术问题
该数据集有效解决了地理信息系统研究中数字基础设施空间建模的精度难题。通过批量地理编码与坐标验证技术,将具有精确坐标的数据中心比例从36.6%提升至70.4%,显著改善了空间分析的准确性。其提供的标准化地理坐标体系,为网络延迟预测、边缘计算节点选址等研究提供了可靠的数据基础。
衍生相关工作
基于该数据集衍生的经典研究包括网络拓扑优化算法开发与数字基础设施韧性评估框架。研究者利用其提供的运营商关联数据构建了多层网络模型,探索了基础设施互联的脆弱性特征。同时,结合热力图分析工具产生的空间聚类成果,为关键信息基础设施保护政策提供了实证依据。
以上内容由遇见数据集搜集并总结生成



