electricsheepafrica/africa-energy-libya
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-energy-libya
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为利比亚 - 能源与矿产,由世界银行集团发布,包含利比亚国家级汇总的能源和矿产指标数据。数据来源于HDX,经过Electric Sheep Africa整理为适合机器学习的Parquet格式。数据集包括训练集(917行)和测试集(229行),涵盖了1962年至2023年的数据。主要指标包括矿产和能源消耗的调整储蓄(当前美元值)、矿石和金属进口占比等。数据集提供了详细的变量描述、快速开始指南、数据模式、数值摘要以及数据清理和限制等信息。
注释创建者: ["无注释"]
语言创建方式: ["获取式(从公开数据源爬取)"]
语言: ["英语"]
许可协议: CC-BY-4.0
多语言属性: ["单语言"]
数据规模区间: ["1000条 < 样本量 < 10000条"]
源数据集: ["原始数据集"]
任务类别: ["表格回归"]
任务子项: []
标签: ["非洲", "人道主义", "HDX(Humanitarian Data Exchange,人道主义数据交换)", "Electric Sheep Africa", "发展", "能源", "指标", "利比亚(LBY,ISO 3166-1 alpha-3代码)"]
展示名称: "利比亚——能源与矿业"
数据集信息:
划分集:
- 名称: 训练集
样本量: 917
- 名称: 测试集
样本量: 229
# 利比亚——能源与矿业
**发布方**:世界银行集团 · **数据源**:[HDX(Humanitarian Data Exchange,人道主义数据交换)](https://data.humdata.org/dataset/world-bank-energy-and-mining-indicators-for-libya) · **许可协议**:`cc-by` · **更新时间**:2026-03-27
---
## 摘要
本数据集包含来自世界银行[数据门户](http://data.worldbank.org/)的相关数据。HDX平台上另有一份[整合型国家数据集](https://data.humdata.org/dataset/world-bank-combined-indicators-for-libya)。
全球经济为维持经济增长、提升生活水平并减少贫困,需要持续增长的能源供给。但当前的能源使用趋势并不具备可持续性。随着全球人口增长与经济工业化程度加深,不可再生能源将愈发稀缺且成本高昂。本数据集收录的能源生产、使用、依赖度与效率相关数据,由世界银行整合自国际能源署(International Energy Agency, IEA)与二氧化碳信息分析中心(Carbon Dioxide Information Analysis Center, CDIAC)。
本数据集的每一行均代表国家层面的汇总统计数据。数据最后一次在HDX平台更新的时间为2026-03-27。地理覆盖范围:**LBY(利比亚ISO 3166-1 alpha-3代码)**。
*本数据集经[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为适配机器学习的Parquet格式。*
---
## 数据集特征
| | |
|---|---|
| **领域** | 人口与人口统计学 |
| **观测单元** | 国家层面汇总统计数据 |
| **总行数** | 1147 |
| **列数** | 8(2个数值型,6个分类型,0个日期时间型) |
| **训练集划分** | 917行 |
| **测试集划分** | 229行 |
| **地理覆盖范围** | LBY(利比亚) |
| **发布方** | 世界银行集团 |
| **HDX最后更新时间** | 2026-03-27 |
---
## 变量说明
**地理类变量**:`country_name`(国家名称:利比亚)、`country_iso3`(国家ISO 3166-1 alpha-3代码:LBY)、`year`(年份:取值范围1962.0–2023.0)。
**结果/测量类变量**:`value`(指标数值:取值范围-645.4775–20847723599.2791)。
**标识符/元数据类变量**:`indicator_name`(指标名称:调整后储蓄:矿产损耗(当期美元)、调整后储蓄:能源损耗(当期美元)、矿石与金属进口额(占商品进口总额百分比))、`indicator_code`(指标代码:NY.ADJ.DMIN.CD、NY.ADJ.DNGY.CD、TM.VAL.MMTL.ZS.UN)、`esa_source`(数据来源:HDX)、`esa_processed`(数据处理时间:2026-04-27)。
---
## 快速入门
python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-energy-libya")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
---
## 数据模式
| 列名 | 数据类型 | 空值占比 | 取值范围/示例值 |
|---|---|---|---|
| `country_name` | 字符串型(object) | 0.0% | 利比亚 |
| `country_iso3` | 字符串型 | 0.0% | LBY |
| `year` | 64位整型(int64) | 0.0% | 1962.0 – 2023.0(均值2003.0654) |
| `indicator_name` | 字符串型 | 0.0% | 调整后储蓄:矿产损耗(当期美元)、调整后储蓄:能源损耗(当期美元)、矿石与金属进口额(占商品进口总额百分比) |
| `indicator_code` | 字符串型 | 0.0% | NY.ADJ.DMIN.CD、NY.ADJ.DNGY.CD、TM.VAL.MMTL.ZS.UN |
| `value` | 64位浮点型(float64) | 0.0% | -645.4775 – 20847723599.2791(均值236062622.2992) |
| `esa_source` | 字符串型 | 0.0% | HDX |
| `esa_processed` | 字符串型 | 0.0% | 2026-04-27 |
---
## 数值型变量统计摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
| `year` | 1962.0 | 2023.0 | 2003.0654 | 2005.0 |
| `value` | -645.4775 | 20847723599.2791 | 236062622.2992 | 4.5802 |
---
## 数据整理流程
原始数据通过CKAN API从HDX平台下载,并转换为Parquet格式。列名统一转换为小写并标准化为蛇形命名法(snake_case)。将常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)统一替换为`NaN`。本数据集采用固定随机种子(42)按80/20的比例划分为训练集与测试集,并以Snappy压缩格式保存为Parquet文件。
---
## 数据局限性
- 本数据集源自世界银行集团,并未经过Electric Sheep Africa的独立验证。
- 自动化清洗流程无法修正原始数据收集中的错报值、定义不一致或抽样偏差问题。
- 如需查看发布方提供的方法说明与注意事项,请参阅[原始HDX数据集页面](https://data.humdata.org/dataset/world-bank-energy-and-mining-indicators-for-libya)。
---
## 引用格式
bibtex
@dataset{hdx_africa_energy_libya,
title = {利比亚——能源与矿业},
author = {世界银行集团},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-energy-and-mining-indicators-for-libya},
note = {经Electric Sheep Africa(https://huggingface.co/electricsheepafrica)重新打包以适配机器学习任务}
}
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施。尼日利亚拉各斯。*
提供机构:
electricsheepafrica



