electricsheepafrica/africa-infrastructure-libya
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-infrastructure-libya
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界银行发布的利比亚基础设施指标数据,涵盖了水资源、能源、通信等多个领域。数据集由国家层面的聚合数据组成,每行代表一个国家级别的数据点。数据经过处理,转换为适合机器学习的Parquet格式,并分为训练集(992行)和测试集(248行)。数据集包含8列,其中2列为数值型,6列为分类型。数据集的地理范围限定为利比亚(LBY),数据最后更新于2026年3月27日。数据集由Electric Sheep Africa整理并发布,旨在为非洲的机器学习项目提供基础设施数据支持。
---
注释创建者:
- 无注释
语言创建者:
- 现有资源采集
语言:
- 英语
许可协议: CC BY 4.0
多语言属性:
- 单语言
数据规模:
- 1000 < 样本数 < 10000
源数据集:
- 原创数据集
任务类别:
- 表格分类
任务子项: []
标签:
- 非洲
- 人道主义
- 人道主义数据交换(Humanitarian Data Exchange,HDX)
- Electric Sheep Africa
- 设施与基础设施
- 指标
- 利比亚(LBY)
美观名称: "利比亚——基础设施"
数据集信息:
划分:
- 名称: 训练集
样本数: 992
- 名称: 测试集
样本数: 248
---
# 利比亚——基础设施
**发布方**:世界银行集团 · **数据来源**:[人道主义数据交换平台(Humanitarian Data Exchange,HDX)](https://data.humdata.org/dataset/world-bank-infrastructure-indicators-for-libya) · **许可协议**:`CC BY` · **最后更新时间**:2026-03-27
---
## 摘要
本数据集包含世界银行[官方数据门户](http://data.worldbank.org/)的相关数据,同时人道主义数据交换平台(HDX)上还发布有[利比亚综合国家指标数据集](https://data.humdata.org/dataset/world-bank-combined-indicators-for-libya)。
基础设施是制造业与农业活动顺利开展的核心决定因素。在供水、环卫、能源、住房与交通领域的投资,不仅能够改善民众生活质量,更有助于减少贫困。而新兴信息与通信技术则可推动经济增长,优化医疗及其他公共服务的供给,拓展教育覆盖范围,并助力社会与文化进步。本数据集的数据源自国际道路联合会、国际集装箱化协会、国际民用航空组织、国际能源署以及国际电信联盟等机构。
本数据集的每一行均代表国家层面的汇总统计数据。数据最后于2026-03-27在HDX平台更新,地理覆盖范围为**利比亚(LBY)**。
*本数据集已由[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为适用于机器学习的Parquet格式。*
---
## 数据集特征
| | |
|---|---|
| **领域** | 公共卫生 |
| **观测单元** | 国家层面汇总数据 |
| **总样本行数** | 1241 |
| **字段数** | 8(2个数值型、6个分类型、0个日期型) |
| **训练集划分** | 992行 |
| **测试集划分** | 248行 |
| **地理覆盖范围** | 利比亚(LBY) |
| **发布方** | 世界银行集团 |
| **HDX平台最后更新时间** | 2026-03-27 |
---
## 字段说明
**地理类字段**:`country_name`(国家名称:利比亚)、`country_iso3`(国家ISO3代码:LBY)、`year`(年份:范围1960.0–2024.0)。
**结果/测量类字段**:`value`(指标数值:范围0.0–358820000.0)。
**标识符/元数据字段**:`indicator_name`(指标名称:可再生内陆淡水资源总量(十亿立方米)、人均可再生内陆淡水资源(立方米)、固定电话订阅量)、`indicator_code`(指标代码:ER.H2O.INTR.K3、ER.H2O.INTR.PC、IT.MLT.MAIN)、`esa_source`(数据来源:HDX)、`esa_processed`(处理时间:2026-04-27)。
---
## 快速上手
以下为快速使用示例:
python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-infrastructure-libya")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
---
## 数据结构
| 字段名 | 数据类型 | 空值占比 | 取值范围/示例值 |
|---|---|---|---|
| `country_name` | 字符串型 | 0.0% | 利比亚 |
| `country_iso3` | 字符串型 | 0.0% | LBY |
| `year` | 整数型 | 0.0% | 1960.0 – 2024.0(均值2000.4464) |
| `indicator_name` | 字符串型 | 0.0% | 可再生内陆淡水资源总量(十亿立方米)、人均可再生内陆淡水资源(立方米)、固定电话订阅量 |
| `indicator_code` | 字符串型 | 0.0% | ER.H2O.INTR.K3、ER.H2O.INTR.PC、IT.MLT.MAIN |
| `value` | 浮点型 | 0.0% | 0.0 – 358820000.0(均值1766608.5864) |
| `esa_source` | 字符串型 | 0.0% | HDX |
| `esa_processed` | 字符串型 | 0.0% | 2026-04-27 |
---
## 数值型字段统计摘要
| 字段名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
| `year` | 1960.0 | 2024.0 | 2000.4464 | 2002.0 |
| `value` | 0.0 | 358820000.0 | 1766608.5864 | 26.8859 |
---
## 数据整理流程
原始数据通过CKAN API从HDX平台下载,并转换为Parquet格式。字段名称统一转换为小写并标准化为蛇形命名法。常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)均被统一替换为`NaN`。本数据集以固定随机种子(42)按80/20的比例划分为训练集与测试集,并以Snappy压缩格式的Parquet文件保存。
---
## 数据集局限性
1. 本数据集数据源自世界银行集团,尚未由Electric Sheep Africa(ESA)进行独立验证。
2. 自动化数据清洗无法修正原始数据集中的错报值、定义不一致问题或采样偏差。
3. 如需了解发布方的方法论说明与免责条款,请参阅[原始HDX数据集页面](https://data.humdata.org/dataset/world-bank-infrastructure-indicators-for-libya)。
---
## 引用格式
bibtex
@dataset{hdx_africa_infrastructure_libya,
title = {Libya - Infrastructure},
author = {World Bank Group},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-infrastructure-indicators-for-libya},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施提供商,尼日利亚拉各斯。*
提供机构:
electricsheepafrica



