Open Firmographic Dataset of Business Companies
收藏github2025-09-17 更新2025-09-18 收录
下载链接:
https://github.com/companydatacom/public-datasets
下载链接
链接失效反馈官方服务:
资源简介:
一个包含全球城市公司详细企业信息的开放数据集,包括地址、注册号、SIC行业代码、收入、员工数量和总部关联信息。该数据集专为研究人员、开发人员、数据分析师和企业设计,用于探索公司级经济活动并构建数据驱动应用
An open dataset providing detailed corporate information for companies located in global cities, covering addresses, registration numbers, SIC industry codes, revenue amounts, employee headcounts, and headquarters association details. Tailored for researchers, developers, data analysts, and enterprises, this dataset supports exploration of firm-level economic activities and the development of data-driven applications.
创建时间:
2025-08-26
原始信息汇总
数据集概述
数据集名称
Open Firmographic Dataset of Business Companies with Addresses, Revenues, and SIC Codes of Cities worldwide
数据集来源
由Companydata.com收集和整理(内部数据聚合)
数据集描述
一个包含详细公司信息的开放数据集,涵盖地址、注册号、SIC行业代码、收入、员工数量和总部关联信息。该数据集专为研究人员、开发人员、数据分析师和企业设计,用于探索公司级经济活动并构建数据驱动应用。
数据集内容
每条记录包含多个描述公司详细信息的字段,包括:
- 公司名称和商号
- 地址(街道、邮政编码、城市、国家)
- 公司注册号
- 业务类别代码和描述(SIC代码)
- 年收入(本地货币和美元)
- 员工数量(现场和总计)
- 总部关联(本地、国家、全球)
- 成立年份
- 进出口代码
覆盖范围
数据集涵盖全球多个城市,包括阿姆斯特丹、柏林、纽约、洛杉矶、罗马、巴黎、马德里和伦敦。
使用案例
- 经济研究和市场分析
- 商业智能仪表板
- 初创企业生态系统映射
- 开放数据应用和黑客马拉松
建议研究练习
- 行业分布分析:按SIC代码或业务类别统计公司数量,目标是识别最常见行业。
- 收入洞察:计算每个行业的总收入和平均收入,目标是发现高收入行业。
- 公司规模分析:按员工规模对公司进行分类,目标是了解本地经济结构。
- 总部网络映射:将子公司与其全球总部关联,目标是可视化跨国存在。
- 历史趋势:分析每十年的成立年份,目标是发现企业创建模式。
许可证信息
- 许可证类型:Creative Commons Zero v1.0 Universal
- 使用权限:可以自由分享和调整数据集,无需请求许可
数据提供方
CompanyData.com为Uber、Booking和Statista等领先组织提供可信数据。数据库覆盖全球超过3.75亿家公司。
联系方式
如有问题、合作或反馈,请联系:info@companydata.com
下载地址
https://companydata.com/free-business-datasets/
关键词
开放数据集公司、公司数据、商业注册、公司收入数据集、SIC代码数据集、公司地址、公共商业数据、开放公司数据库
搜集汇总
数据集介绍

构建方式
在商业数据科学领域,Open Firmographic Dataset of Business Companies的构建依托于CompanyData.com的内部数据聚合技术,系统性地整合了全球范围内超过3.75亿家企业的公开信息。数据采集过程涵盖了企业注册信息、财务指标及行业分类代码等多维度内容,并通过自动化流程进行清洗与标准化,确保了数据的一致性与可靠性。所有记录均遵循统一的结构化框架,使得数据集能够全面反映企业的经营属性与地理分布特征。
特点
该数据集的核心特点在于其丰富而精细的企业画像信息,涵盖公司名称、地址、注册号、行业分类代码、年度营收、雇员规模及总部关联等关键字段。数据覆盖阿姆斯特丹、柏林、纽约、巴黎等全球主要城市,兼具地域多样性与行业代表性。其高度结构化的组织形式与清晰的字段定义,为经济研究与商业分析提供了坚实的数据基础,尤其适合用于跨国比较与宏观趋势分析。
使用方法
研究人员可通过该数据集开展多项实证分析,例如基于SIC代码进行行业分布统计,或按营收与雇员规模对企业进行分层研究。数据支持CSV等通用格式下载,可直接导入统计分析工具或数据库系统。用户可依据研究目标灵活提取子集,如特定城市或行业的公司记录,亦可通过总部关联字段构建企业网络图谱,助力商业智能应用与区域经济研究。
背景与挑战
背景概述
企业开放数据集的构建源于对全球商业活动系统化分析的需求,由CompanyData.com于近年主导开发。该数据集整合了阿姆斯特丹、柏林、纽约等全球主要城市的公司信息,涵盖企业名称、地址、收入、行业分类代码及雇员规模等多维度数据。其核心研究问题聚焦于通过标准化企业画像数据支持宏观经济研究、市场分析及商业智能应用,为学术界和产业界提供了高质量的基础数据资源,显著促进了城市经济生态和跨国公司网络的研究进展。
当前挑战
该数据集致力于解决企业级经济活动的多维度量化分析挑战,特别是在行业分类标准化、跨国公司关联识别以及经济指标跨地域可比性等方面存在显著复杂性。构建过程中面临数据采集与清洗的艰巨任务,需整合异构来源的注册信息、财务数据及组织结构,同时确保数据的一致性与准确性;此外,跨国数据合规性与隐私保护要求亦增加了数据处理的难度,需在开放共享与法律约束间寻求平衡。
常用场景
经典使用场景
在商业地理学和区域经济学研究中,该数据集为分析城市商业空间分布提供了核心数据支撑。研究人员通过企业地址与行业代码的关联分析,能够精确绘制不同行业在特定城市的集聚图谱,揭示产业集群的形成机制与空间演变规律。这类分析常被用于比较不同城市产业结构的异同,为区域经济政策制定提供量化依据。
实际应用
商业智能领域将该数据集广泛应用于市场潜力评估与竞争格局分析。企业通过行业代码与营收数据的交叉分析,可精准识别目标市场的优势行业与潜在合作伙伴。政府部门则借助员工规模与成立年份数据监测区域就业动态与企业生命周期,为中小企业扶持政策提供数据支撑。风险投资机构更将其用于初创企业生态图谱构建,辅助投资决策。
衍生相关工作
基于该数据集衍生的经典研究包括跨国企业网络拓扑分析、城市产业多样性指数测算以及经济韧性评估框架构建。诸多学者利用其总部-分支机构关联数据构建全球企业控制网络图谱,发表于《自然》等顶级期刊。另有研究团队结合历史成立年份数据,开创了企业种群生态演化模型,为区域经济预测提供了新方法论。
以上内容由遇见数据集搜集并总结生成



