five

electricsheepafrica/african-timeseries-annual-temperature-1901-2021

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/african-timeseries-annual-temperature-1901-2021
下载链接
链接失效反馈
官方服务:
资源简介:
非洲年度时间序列温度数据集(1901-2021年)包含了1901年至2021年非洲多个国家的年平均温度记录。数据集以表格形式呈现,每行代表一条记录。数据最后更新于2023年10月17日,地理范围为非洲(多个国家)。数据集由世界银行发布,并通过OpenAfrica获取,由Electric Sheep Africa整理为适合机器学习的Parquet格式。数据集分为训练集(97行)和测试集(24行),共包含14列(12个数值列,2个分类列)。

annotations_creators: - 无注释 language_creators: - 采集获取 language: - 英语 license: cc-by-4.0 multilinguality: - 单语言 size_categories: - 样本规模少于1000条 source_datasets: - 原生数据集 task_categories: - 表格回归 task_ids: [] tags: - 非洲 - 人道主义 - HDX - Electric Sheep Africa(电羊非洲) - 年度 - 气温 pretty_name: "非洲年度气温时间序列(1901-2021)" dataset_info: splits: - name: 训练集 num_examples: 97 - name: 测试集 num_examples: 24 # 非洲年度气温时间序列(1901-2021) **发布方**:世界银行 · **来源**:[OpenAfrica](https://open.africa/dataset/african-timeseries-annual-temperature-1901-2021) · **许可证**:`cc-by` · **更新时间**:2023-10-17 --- ## 摘要 本数据集收录了1901年至2021年的年均气温数据。每行均为表格记录,数据最后于2023年10月17日在OpenAfrica平台更新。地理覆盖范围:**非洲(多国)**。 *由[Electric Sheep Africa(电羊非洲)](https://huggingface.co/electricsheepafrica)整理为适配机器学习的Parquet格式(Parquet)。* --- ## 数据集特征 | | | |---|---| | **领域** | 人道主义与发展数据 | | **观测单元** | 表格记录 | | **总行数** | 122 | | **列数** | 14列(12个数值列、2个分类列、0个日期时间列) | | **训练集划分** | 97行 | | **测试集划分** | 24行 | | **地理覆盖范围** | 非洲(多国) | | **发布方** | 世界银行 | | **OpenAfrica最后更新时间** | 2023-10-17 | --- ## 变量 **标识符/元数据**:`unnamed_2`(取值范围18.18~20.79)、`unnamed_3`(18.05~20.45)、`unnamed_4`(18.96~21.38)、`unnamed_5`(21.06~23.41)、`unnamed_6`(21.12~23.56),另有7个同类型列。 **其他变量**:`variable`(取值范围1901.0~2021.0)、`tas`(取值范围20.32~22.79)。 --- ## 快速上手 python from datasets import load_dataset ds = load_dataset("electricsheepafrica/african-timeseries-annual-temperature-1901-2021") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() --- ## 数据模式 | 列名 | 数据类型 | 空值占比 | 取值范围/示例值 | |---|---|---|---| | `variable` | float64 | 0.8% | 1901.0 ~ 2021.0(均值1961.0) | | `tas` | float64 | 0.8% | 20.32 ~ 22.79(均值21.2995) | | `unnamed_2` | float64 | 0.8% | 18.18 ~ 20.79(均值19.2482) | | `unnamed_3` | float64 | 0.8% | 18.05 ~ 20.45(均值18.9945) | | `unnamed_4` | float64 | 0.8% | 18.96 ~ 21.38(均值19.9916) | | `unnamed_5` | float64 | 0.8% | 21.06 ~ 23.41(均值21.9895) | | `unnamed_6` | float64 | 0.8% | 21.12 ~ 23.56(均值22.0698) | | `unnamed_7` | float64 | 0.8% | 20.63 ~ 23.21(均值21.728) | | `unnamed_8` | float64 | 0.8% | 19.76 ~ 22.41(均值20.8617) | | `unnamed_9` | float64 | 0.8% | 19.96 ~ 22.44(均值20.9268) | | `unnamed_10` | float64 | 0.8% | 20.85 ~ 23.43(均值21.8669) | | `unnamed_11` | float64 | 0.8% | 19.15 ~ 21.51(均值20.0981) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-27 | --- ## 数值统计摘要 | 列名 | 最小值 | 最大值 | 均值 | 中位数 | |---|---|---|---|---| | `variable` | 1901.0 | 2021.0 | 1961.0 | 1961.0 | | `tas` | 20.32 | 22.79 | 21.2995 | 21.24 | | `unnamed_2` | 18.18 | 20.79 | 19.2482 | 19.21 | | `unnamed_3` | 18.05 | 20.45 | 18.9945 | 18.96 | | `unnamed_4` | 18.96 | 21.38 | 19.9916 | 19.97 | | `unnamed_5` | 21.06 | 23.41 | 21.9895 | 21.97 | | `unnamed_6` | 21.12 | 23.56 | 22.0698 | 22.02 | | `unnamed_7` | 20.63 | 23.21 | 21.728 | 21.67 | | `unnamed_8` | 19.76 | 22.41 | 20.8617 | 20.8 | | `unnamed_9` | 19.96 | 22.44 | 20.9268 | 20.86 | | `unnamed_10` | 20.85 | 23.43 | 21.8669 | 21.84 | | `unnamed_11` | 19.15 | 21.51 | 20.0981 | 20.05 | --- ## 数据整理流程 原始数据通过CKAN API从OpenAfrica平台下载,并转换为Parquet格式(Parquet)。列名均转换为小写并统一为蛇形命名法。常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)被统一替换为`NaN`。基于解析成功率(阈值>85%),将11列从字符串类型转换为数值或日期时间类型。本数据集以固定随机种子(42)按80/20比例划分为训练集与测试集,并保存为Snappy压缩的Parquet格式(Snappy)。 --- ## 局限性 1. 数据源自世界银行,尚未由Electric Sheep Africa(ESA)进行独立验证。 2. 自动化清洗流程无法修正原始数据集中的错报值、定义不一致问题或采样偏差。 3. 请参阅[原始HDX数据集页面](https://open.africa/dataset/african-timeseries-annual-temperature-1901-2021)以获取发布方提供的方法说明与注意事项。 --- ## 引用 bibtex @dataset{openafrica_african_timeseries_annual_temperature_1901_2021, title = {非洲年度气温时间序列(1901-2021)}, author = {世界银行}, year = {2023}, url = {https://open.africa/dataset/african-timeseries-annual-temperature-1901-2021}, note = {由Electric Sheep Africa(电羊非洲)(https://huggingface.co/electricsheepafrica)重新打包适配机器学习应用} } --- *[Electric Sheep Africa(电羊非洲)](https://huggingface.co/electricsheepafrica) — 非洲的机器学习数据集基础设施,位于尼日利亚拉各斯。*
提供机构:
electricsheepafrica
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作