five

Saudi Real Estate Open Data

收藏
github2026-04-09 更新2026-04-10 收录
下载链接:
https://github.com/civillizard/Saudi-Real-Estate-Data
下载链接
链接失效反馈
官方服务:
资源简介:
沙特房地产开放数据集,整合了沙特阿拉伯司法部、房地产总局、KAPSARC和沙特中央银行的数据,涵盖了2014年至2026年的750万条房地产记录,分布在312个CSV文件中。数据集包括销售交易、房地产操作、市场指数、租赁指标等多种类型的数据。

Saudi Arabia Real Estate Open Dataset integrates data from the Ministry of Justice of Saudi Arabia, General Authority for Real Estate, KAPSARC, and the Saudi Central Bank. It covers 7.5 million real estate records spanning from 2014 to 2026, distributed across 312 CSV files. This dataset includes multiple types of data such as sales transactions, real estate operations, market indices, and rental indicators.
创建时间:
2026-03-25
原始信息汇总

沙特房地产开放数据集概述

数据集基本信息

  • 数据集名称:Saudi Real Estate Open Data (بيانات العقار المفتوحة)
  • 存储库地址:https://github.com/civillizard/Saudi-Real-Estate-Data
  • 数据来源:沙特阿拉伯司法部、房地产总局、阿卜杜拉国王石油研究中心、沙特中央银行
  • 数据总量:约750万条房地产记录
  • 文件数量:312个CSV文件
  • 时间范围:2014年至2026年
  • 数据许可:KSA Open Data License
  • 代码许可:MIT License

数据内容摘要

数据来源与分类

来源机构 数据类别 文件数量 记录行数 时间周期 描述
司法部 销售交易 24 1,407,000 2020–2025 单笔销售记录:价格、面积、位置、分类、参考编号
司法部 房地产操作 215 5,959,000 2023–2026 抵押、扣押、转让、授权书、执行、赠予、补偿、契约更新、合并、分割、月度汇总等36类操作
司法部 市场指数 3 3,000 2018–2021 按地区、城市、区域划分的历史价格指数
房地产总局 销售指标 31 21,000 2024–2025 按地区汇总的销售数据:每平方米平均/最低/最高价格、契约数量
房地产总局 租赁指标 13 20,000 2019–2024 所有13个行政区的城市租赁市场数据
房地产总局 其他数据 2 32,700 2024–2025 性别登记统计、综合季度报告
房地产总局 图表 8 2024–2025 信息图可视化文件
阿卜杜拉国王石油研究中心 房地产价格指数 4 2,867 2014–2024 全国及地区房地产价格指数
阿卜杜拉国王石油研究中心 建筑成本 1 449 2014–2024 按部门和部分划分的建筑成本指数
沙特中央银行 金融与抵押贷款 9 1,091 2009–2025 银行房地产贷款、按类型划分的新抵押贷款、金融公司房地产风险敞口、房地产发展基金贷款、居民消费价格指数住房部分

关键统计数字

  • 交易总量:141万笔销售交易,覆盖沙特全部13个地区、175个城市、13,398个街区。
  • 总交易价值:1,426.8亿沙特里亚尔(约3800亿美元),时间跨度为2020年至2025年。
  • 物业分类分布:85%为住宅,10.6%为商业,4%为农业,工业占比小于0.1%。
  • 主导地区:利雅得占所有交易的34%,占总价值的49%。
  • 前五大城市:利雅得(33万笔交易)、吉达(16.4万笔)、布赖代(6.2万笔)、麦加(5.3万笔)、麦地那(5.2万笔)。
  • 操作类别:除销售外,还有36种交易类别,包括抵押、扣押、财产分割、授权书、执行、赠予、补偿、所有权比率、月度汇总等。

数据来源说明

  • 司法部:通过公证处登记所有房地产交易,提供交易级数据(单笔记录,含精确价格、面积、日期和参考编号)。
  • 房地产总局:发布汇总指标(每平方米平均价格、交易数量、按地区和季度划分的租赁指标),包含司法部数据所没有的租赁数据和物业类型细分。
  • 阿卜杜拉国王石油研究中心:发布基于沙特统计总局数据的房地产价格指数和建筑成本指数。
  • 沙特中央银行:发布包含银行抵押贷款数据、按类型划分的新住宅抵押贷款、金融公司房地产风险敞口、房地产发展基金贷款和居民消费价格指数住房部分的月度统计公报。

数据对比(司法部 vs 房地产总局)

方面 司法部 房地产总局
数据级别 单笔交易 汇总指标
包含单笔交易精确价格 否(提供每平方米平均/最低/最高价格)
包含单笔交易精确面积 否(提供每组合计)
包含参考编号
包含租赁数据 是(覆盖全部13个地区)
包含物业类型 仅2023年第一季度至第三季度 是(在指标文件中)
时间范围 2020–2025(销售),2024–2025(操作) 2024–2025(销售),2019–2024(租赁)
地区覆盖 全部13个地区 6个地区(销售),13个地区(租赁)

已知数据局限性

  1. 无法追踪物业生命周期:参考编号是按交易分配的,不是按物业分配的。
  2. 缺乏土地与建筑物的明确区分:标准“物业分类”列仅说明住宅/商业/农业,不区分是地块还是已建别墅(2023年第一季度至第三季度及房地产总局汇总数据除外)。
  3. “物业身份”文件是服务日志,并非连接交易的物业登记簿。
  4. 地区名称存在33种变体:同一地区在不同文件中以不同的阿拉伯语拼写出现。
  5. 日期格式不一致:大多数文件使用YYYY/MM/DD,部分2024年月度文件使用M/D/YYYY。大多数文件同时包含公历和回历日期。
  6. 数字格式使用逗号千位分隔符:价格和面积字段使用逗号作为千位分隔符,在进行数值运算前需移除逗号。
  7. 房地产总局销售数据覆盖不全:13个地区中只有6个地区有房地产总局销售指标数据。
  8. 2023年数据异常:交易量从2021年的28.2万笔下降至14万笔。此外,2023年第一季度的数据模式不同。
  9. 强制执行销售数据模式变更:第一季度有6列,第二至第四季度有5列。

存储库结构

主要目录包含来自四个来源的数据文件(moj/, rega/, kapsarc/, sama/),以及用于数据管理、分析和监控的脚本、文档和工具。

相关资源

  • 术语表:提供50多个阿拉伯语房地产术语的英文翻译。
  • 数据字典:完整的字段目录,包含从阿拉伯语映射的41个规范字段、所有类别的模式、枚举值及翻译。
  • 分析思路:包含44个按可行性、独特性和商业价值评分的分析想法。
  • 数据质量审计报告:包含对文件完整性、资产类型、参考编号、物业身份等方面的详细审计结果。
搜集汇总
数据集介绍
main_image_url
构建方式
在沙特阿拉伯房地产数据领域,该数据集通过整合多个官方机构发布的异构数据源构建而成。其构建过程涉及从沙特司法部、房地产总局、阿卜杜拉国王石油研究中心以及沙特中央银行的开放数据门户中,系统性地采集了自2014年至2026年间的312个CSV文件,涵盖约750万条房地产交易记录。数据整合工作包括对阿拉伯语表头的标准化翻译、不一致日期格式的统一、逗号分隔数字的清洗,并建立了包含41个规范字段的自描述元数据注册表,从而将原本分散且格式不一的数据转化为结构清晰、文档完备的统一资源。
特点
该数据集的核心特点在于其多源性与高粒度。它不仅聚合了司法部提供的个体交易级数据,包含精确的交易价格、面积及参考编号,还融合了房地产总局发布的区域聚合指标,如每平方米平均价格及租赁市场数据。数据集覆盖沙特全部13个行政区域,包含住宅、商业、农业等多种资产分类,并提供了从交易操作到市场指数的36个类别。此外,数据集附带了详尽的数据质量审计报告与术语词典,明确了其无法追踪资产全生命周期等局限性,确保了使用的透明度与可靠性。
使用方法
研究人员与分析师可通过直接读取CSV文件或利用提供的Python脚本进行数据访问与分析。典型的使用流程包括加载并合并多个季度的交易文件,清洗价格与面积字段中的千位分隔符,并应用区域名称映射表以统一阿拉伯语拼写变体。数据集配套的Jupyter笔记本示例展示了如何生成交易量趋势、区域价格热图等可视化分析。对于高级应用,可利用元数据注册表进行字段映射与模式理解,并参考分析想法文档探索区域价格动态、监管政策影响等44项研究课题。
背景与挑战
背景概述
沙特房地产开放数据集(Saudi Real Estate Open Data)由独立研究者整合沙特阿拉伯司法部、房地产总局、阿卜杜拉国王石油研究中心及沙特中央银行等多源官方数据构建而成,涵盖2014年至2026年间约750万条房地产交易记录。该数据集旨在解决沙特房地产数据分散于不同政府门户、格式不一致且缺乏标准化文档的核心问题,通过统一清洗与元数据注册,为市场分析、政策研究与投资决策提供结构化支持。其创建反映了沙特开放数据运动的深化,对理解该国城市化进程、住房政策效能及区域经济发展具有重要实证价值。
当前挑战
该数据集致力于解决房地产交易分析与市场监测中的多源异构数据整合挑战,包括跨部门数据模式对齐、时空维度下的指标可比性构建以及微观交易行为与宏观市场趋势的关联建模。在构建过程中,面临原始数据阿拉伯语表头翻译、区域名称拼写变体归一化、日期格式不一致以及部分季度数据模式突变等具体障碍。此外,数据覆盖存在缺口,如房地产总局销售指标仅涵盖6个地区,且缺乏贯穿资产全生命周期的唯一标识符,限制了跨交易类别的连续性分析。
常用场景
经典使用场景
在房地产经济学与区域发展研究领域,Saudi Real Estate Open Data为学者提供了剖析沙特阿拉伯房地产市场动态的珍贵素材。该数据集最经典的使用场景在于支持对全国及区域层级的房地产交易趋势进行量化分析。研究者可借助其涵盖的750万条交易记录,深入探究不同行政区域、城市乃至社区层面的价格波动、交易量变化以及资产分类分布,从而揭示市场周期、季节性模式及结构性转变。例如,通过整合司法部(MOJ)的详细交易数据与房地产总局(REGA)的聚合指标,能够构建从微观到宏观的完整市场画像,为理解沙特在“2030愿景”下的住房市场转型提供实证基础。
衍生相关工作
围绕该数据集已衍生出多项具有代表性的研究工作与分析框架。其维护者构建的元数据注册表(registry)与数据字典,为自动化数据集成与质量验证设立了标准,启发了对多源政府开放数据融合方法的研究。基于数据集开发的分析笔记本(notebooks)展示了从交易量时序分析到区域价格热图生成的全套流程,成为应用计量经济学与空间数据分析的教学范例。此外,伴随数据集发布的深度审计报告(如资产类型审计、参考编号审计)揭示了行政数据在产权追踪方面的固有局限,推动了关于如何利用非传统数据源构建房地产生命周期记录的方法论讨论。这些工作共同构成了一个开放、可复现的研究生态系统,激励着后续在市场预测、政策模拟等方向的探索。
数据集最近研究
最新研究方向
在沙特房地产开放数据领域,前沿研究聚焦于利用大规模交易记录与宏观指标融合分析,以揭示市场深层动态。当前热点围绕沙特“2030愿景”推动的住房改革与土地税政策,学者们正通过该数据集评估白地税(White Land Tax)分级实施对特定区域交易活跃度与价格波动的影响。同时,结合央行抵押贷款数据与租赁指标,研究试图构建租金收益率模型,为投资者提供跨区域收益预测。这些分析不仅助力政策效果量化,也为识别新兴城市增长极提供了数据基石,对理解中东地区房地产市场的结构性演变具有重要参考意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作