five

electricsheepafrica/africa-infrastructure-libya

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-infrastructure-libya
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界银行发布的利比亚基础设施指标数据,涵盖了水资源、能源、通信等多个领域。数据集由国家层面的聚合数据组成,每行代表一个国家级别的数据点。数据经过处理,转换为适合机器学习的Parquet格式,并分为训练集(992行)和测试集(248行)。数据集包含8列,其中2列为数值型,6列为分类型。数据集的地理范围限定为利比亚(LBY),数据最后更新于2026年3月27日。数据集由Electric Sheep Africa整理并发布,旨在为非洲的机器学习项目提供基础设施数据支持。

--- 注释创建者: - 无注释 语言创建者: - 现有资源采集 语言: - 英语 许可协议: CC BY 4.0 多语言属性: - 单语言 数据规模: - 1000 < 样本数 < 10000 源数据集: - 原创数据集 任务类别: - 表格分类 任务子项: [] 标签: - 非洲 - 人道主义 - 人道主义数据交换(Humanitarian Data Exchange,HDX) - Electric Sheep Africa - 设施与基础设施 - 指标 - 利比亚(LBY) 美观名称: "利比亚——基础设施" 数据集信息: 划分: - 名称: 训练集 样本数: 992 - 名称: 测试集 样本数: 248 --- # 利比亚——基础设施 **发布方**:世界银行集团 · **数据来源**:[人道主义数据交换平台(Humanitarian Data Exchange,HDX)](https://data.humdata.org/dataset/world-bank-infrastructure-indicators-for-libya) · **许可协议**:`CC BY` · **最后更新时间**:2026-03-27 --- ## 摘要 本数据集包含世界银行[官方数据门户](http://data.worldbank.org/)的相关数据,同时人道主义数据交换平台(HDX)上还发布有[利比亚综合国家指标数据集](https://data.humdata.org/dataset/world-bank-combined-indicators-for-libya)。 基础设施是制造业与农业活动顺利开展的核心决定因素。在供水、环卫、能源、住房与交通领域的投资,不仅能够改善民众生活质量,更有助于减少贫困。而新兴信息与通信技术则可推动经济增长,优化医疗及其他公共服务的供给,拓展教育覆盖范围,并助力社会与文化进步。本数据集的数据源自国际道路联合会、国际集装箱化协会、国际民用航空组织、国际能源署以及国际电信联盟等机构。 本数据集的每一行均代表国家层面的汇总统计数据。数据最后于2026-03-27在HDX平台更新,地理覆盖范围为**利比亚(LBY)**。 *本数据集已由[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为适用于机器学习的Parquet格式。* --- ## 数据集特征 | | | |---|---| | **领域** | 公共卫生 | | **观测单元** | 国家层面汇总数据 | | **总样本行数** | 1241 | | **字段数** | 8(2个数值型、6个分类型、0个日期型) | | **训练集划分** | 992行 | | **测试集划分** | 248行 | | **地理覆盖范围** | 利比亚(LBY) | | **发布方** | 世界银行集团 | | **HDX平台最后更新时间** | 2026-03-27 | --- ## 字段说明 **地理类字段**:`country_name`(国家名称:利比亚)、`country_iso3`(国家ISO3代码:LBY)、`year`(年份:范围1960.0–2024.0)。 **结果/测量类字段**:`value`(指标数值:范围0.0–358820000.0)。 **标识符/元数据字段**:`indicator_name`(指标名称:可再生内陆淡水资源总量(十亿立方米)、人均可再生内陆淡水资源(立方米)、固定电话订阅量)、`indicator_code`(指标代码:ER.H2O.INTR.K3、ER.H2O.INTR.PC、IT.MLT.MAIN)、`esa_source`(数据来源:HDX)、`esa_processed`(处理时间:2026-04-27)。 --- ## 快速上手 以下为快速使用示例: python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-infrastructure-libya") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() --- ## 数据结构 | 字段名 | 数据类型 | 空值占比 | 取值范围/示例值 | |---|---|---|---| | `country_name` | 字符串型 | 0.0% | 利比亚 | | `country_iso3` | 字符串型 | 0.0% | LBY | | `year` | 整数型 | 0.0% | 1960.0 – 2024.0(均值2000.4464) | | `indicator_name` | 字符串型 | 0.0% | 可再生内陆淡水资源总量(十亿立方米)、人均可再生内陆淡水资源(立方米)、固定电话订阅量 | | `indicator_code` | 字符串型 | 0.0% | ER.H2O.INTR.K3、ER.H2O.INTR.PC、IT.MLT.MAIN | | `value` | 浮点型 | 0.0% | 0.0 – 358820000.0(均值1766608.5864) | | `esa_source` | 字符串型 | 0.0% | HDX | | `esa_processed` | 字符串型 | 0.0% | 2026-04-27 | --- ## 数值型字段统计摘要 | 字段名 | 最小值 | 最大值 | 均值 | 中位数 | |---|---|---|---|---| | `year` | 1960.0 | 2024.0 | 2000.4464 | 2002.0 | | `value` | 0.0 | 358820000.0 | 1766608.5864 | 26.8859 | --- ## 数据整理流程 原始数据通过CKAN API从HDX平台下载,并转换为Parquet格式。字段名称统一转换为小写并标准化为蛇形命名法。常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)均被统一替换为`NaN`。本数据集以固定随机种子(42)按80/20的比例划分为训练集与测试集,并以Snappy压缩格式的Parquet文件保存。 --- ## 数据集局限性 1. 本数据集数据源自世界银行集团,尚未由Electric Sheep Africa(ESA)进行独立验证。 2. 自动化数据清洗无法修正原始数据集中的错报值、定义不一致问题或采样偏差。 3. 如需了解发布方的方法论说明与免责条款,请参阅[原始HDX数据集页面](https://data.humdata.org/dataset/world-bank-infrastructure-indicators-for-libya)。 --- ## 引用格式 bibtex @dataset{hdx_africa_infrastructure_libya, title = {Libya - Infrastructure}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-infrastructure-indicators-for-libya}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施提供商,尼日利亚拉各斯。*
提供机构:
electricsheepafrica
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作