ayookuns/abuja-housing-prices-v1
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/ayookuns/abuja-housing-prices-v1
下载链接
链接失效反馈官方服务:
资源简介:
这是第一个公开的、结构化的阿布贾住宅物业价格数据集,涵盖了尼日利亚联邦首都特区16个地区的租赁和销售列表。数据集由Groundwork Data收集,这是一个尼日利亚的公民数据项目,旨在构建结构化的、特定领域的数据集,以满足尼日利亚机器学习工程师、研究人员和初创企业的实际需求。尼日利亚在结构化数据方面存在严重缺口,该项目旨在解决这一问题。
This is the first public, structured dataset of Abuja residential property prices — covering both rental and sale listings across 16 areas of Nigerias Federal Capital Territory. Collected by Groundwork Data, a Nigerian civic data project building the structured, domain-specific datasets that Nigerian ML engineers, researchers, and startups actually need. Nigeria has a severe structured data gap. This project is fixing that.
提供机构:
ayookuns
搜集汇总
数据集介绍

构建方式
该数据集由尼日利亚公民数据项目Groundwork Data构建,旨在填补尼日利亚结构化数据严重缺失的空白。数据通过爬取PropertyPro.ng房产网站获取,覆盖尼日利亚联邦首都区阿布贾的16个区域,收录了481条住宅物业挂牌信息,包含250条租赁信息和231条销售信息。每条记录涵盖标题、价格、区域、街区、地址、居室数、卫生间数、物业类型等15个字段,数据经过清理和结构化处理,形成首个公开的阿布贾房价基础数据集。
特点
数据集独特之处在于其针对非洲高增长市场的稀缺性,为尼日利亚本地机器学习工程师、研究人员和初创企业提供了亟需的领域特定数据。收录了7种物业类型,价格范围从80万奈拉到50亿奈拉,覆盖了从经济型公寓到豪宅的完整市场谱系。数据集还包含了标题、描述、挂牌ID、添加日期等元信息,并提供了经基线随机森林模型验证的可靠预测能力,租金模型CV R²达0.79,销售模型达0.71。
使用方法
数据可直接通过Python的pandas库读取CSV文件使用,推荐按租赁和销售类型分别分析。用户可利用'listing_type'字段分离租金和销售数据,通过'area'和'neighbourhood'字段进行区域价格分析,以'bedrooms'和'bathrooms'等特征构建回归模型。完整的基础模型笔记本已在Kaggle上公开,便于用户复现研究或进行自定义建模。数据集采用CC BY 4.0许可证,适合学术研究和商业应用。
背景与挑战
背景概述
在非洲最大经济体尼日利亚,住房市场的结构化数据长期处于匮乏状态,严重制约了房地产相关机器学习应用的本土化发展。为弥合这一关键数据鸿沟,尼日利亚公民数据项目Groundwork Data于2026年4月发布了阿布贾住房价格数据集(Abuja Housing Prices v1),这是首个系统收录尼日利亚联邦首都区16个区域住宅租赁与销售挂牌信息的公开结构化数据集,涵盖481条记录、7种物业类型,价格跨度从80万奈拉至50亿奈拉。该数据集由团队通过爬取PropertyPro.ng平台构建,旨在为本地机器学习工程师、研究人员及初创企业提供支撑区域经济分析与智能决策的基础资源,填补了尼日利亚房地产领域结构化公共数据的空白,对推动非洲数据驱动型房地产研究具有里程碑意义。
当前挑战
该数据集所解决的领域核心挑战在于尼日利亚房地产市场中高质量结构化数据的系统性缺失,导致房价预测、区域价值评估等建模任务长期依赖不完整或非公开的零散信息,严重阻碍了本土化智能应用的落地。在构建过程中,数据集面临多重挑战:首先,房屋面积(平方米)作为建模的关键特征因平台未统一列示而无法获取,成为缺失最重要的变量;其次,缺乏地理坐标数据,仅能依赖区域名称进行空间定位,制约了空间分析精度;此外,数据来源单一,仅覆盖PropertyPro.ng一个平台,未能整合如NigeriaPropertyCentre等其他主流挂牌渠道;同时,当前版本为一次性快照,无法支持时间序列趋势分析;最后,描述字段被通用免责声明占据,不具备作为文本特征的实质内容价值,进一步削弱了建模能力。
常用场景
经典使用场景
阿布贾住房价格数据集(Abuja Housing Prices v1)是尼日利亚首个公开的结构化住宅价格数据集,涵盖首都阿布贾16个区域的481条房产挂牌信息,包含租赁与出售两种交易类型。该数据集在房地产估值与价格预测领域具有经典应用价值,研究人员可基于卧室数量、物业类型、地理位置等特征构建回归模型,探索影响住房价格的核心因素。基线随机森林模型在租金和售价预测上分别达到0.79和0.71的交叉验证R²值,充分证明了该数据集在房价建模中的有效性与可靠性。
解决学术问题
该数据集有效填补了尼日利亚结构化数据缺失的空白,解决了非洲城市住房市场研究中长期存在的数据匮乏难题。通过提供系统化的房产价格、区域分布和物业特征信息,研究者能够深入探讨新兴经济体城市住房价格的空间分异规律,分析不同区域(如高档社区Maitama与普通社区Kubwa之间)的价格差异成因。该数据集还为研究发展中市场房地产市场的定价机制、住房可负担性评估以及城市空间结构演化提供了重要数据基础,具有显著的学术推动意义。
衍生相关工作
围绕该数据集已衍生出一系列经典研究工作和实践项目,包括基于特征工程与机器学习算法的阿布贾住房价格预测基准模型,以及采用随机森林、梯度提升树等集成学习方法进行区域房价异质性分析的学术论文。数据提供方Groundwork Data计划推出拉各斯住房价格数据集和尼日利亚学校按地方政府区域分布数据集,形成覆盖西非主要城市的系统性数据基础设施。这些延伸工作不仅复制了该数据集的构建方法,更推动了非洲发展中国家数据驱动型住房研究和城市科学的发展。
以上内容由遇见数据集搜集并总结生成



