city_temperature_anomalies
收藏Hugging Face2025-11-14 更新2025-11-15 收录
下载链接:
https://huggingface.co/datasets/ESmike/city_temperature_anomalies
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含多个国家配置的气候数据集,每个配置包含年、月、月度异常值、年度异常值、五年和十年异常值等气候特征,以及经纬度、附近城市、水资源比例、200公里内气象站数量、1951年至1980年的绝对温度、城市、国家、自1960年以来的升温趋势等地理信息。数据集还包括训练数据的示例数量和大小。
创建时间:
2025-11-13
原始信息汇总
城市温度异常数据集概述
数据集基本信息
- 数据集名称: city_temperature_anomalies
- 数据源地址: https://huggingface.co/datasets/ESmike/city_temperature_anomalies
- 配置数量: 20个国家配置
数据结构
特征字段
- 时间维度: year, month
- 温度异常值: monthly_anomaly, annual_anomaly, five_year_anomaly, ten_year_anomaly, twenty_year_anomaly
- 不确定性指标: monthly_uncertainty, annual_uncertainty, five_year_uncertainty, ten_year_uncertainty, twenty_year_uncertainty
- 绝对温度: monthly_absolute, absolute_temp_1951_1980
- 地理位置: latitude, longitude, city, country, letter
- 环境信息: nearby_cities, percent_water, stations_within_200km
- 变暖趋势: warming_since_1960_c_per_century
- 技术字段: index_level_0
数据分割
- 训练集: 所有配置均包含train分割
- 样本数量: 从2,136到65,288不等
- 数据大小: 从371KB到15.4MB不等
国家配置示例
- 阿富汗: 17,828个样本,4.47MB
- 阿尔巴尼亚: 10,002个样本,2.83MB
- 阿尔及利亚: 16,670个样本,3.70MB
- 阿根廷: 65,288个样本,15.44MB
- 澳大利亚: 37,435个样本,9.22MB
- 孟加拉国: 48,600个样本,13.42MB
数据特征
- 时间跨度: 包含年月数据
- 空间覆盖: 全球多个国家城市
- 温度基准: 以1951-1980年为基准期
- 多尺度分析: 提供月、年、5年、10年、20年不同时间尺度的温度异常分析
搜集汇总
数据集介绍

构建方式
在全球气候变化研究领域,该数据集通过整合多国气象观测站的历史温度记录构建而成。数据采集基于标准化气象测量协议,以1951-1980年期间的温度数据为基准计算异常值,采用地理空间插值技术将离散站点数据转化为城市尺度的连续温度序列。每个数据点都经过质量控制流程,包括异常值检测和测量误差校正,确保数据在时间维度和空间维度上的可比性与一致性。
特点
该数据集最显著的特征在于其多维度的温度异常量化体系,涵盖月尺度、年尺度以及五年至二十年不等的长期趋势分析。每个温度异常值均配备相应的不确定性度量,为气候模型验证提供可靠的误差范围参考。数据集的空间覆盖范围广泛,包含从阿富汗至波黑等数十个国家的城市数据,并附带经纬度坐标、周边城市关联性及水域覆盖率等地理属性,为区域气候差异性研究创造了条件。
使用方法
研究人员可通过指定国家配置名称加载相应数据子集,利用月度异常值进行短期气候波动分析,或基于十年、二十年尺度数据开展长期变暖趋势研究。数据集中提供的绝对温度基准与变暖速率指标,可直接用于气候模型精度验证和预测性能评估。地理空间字段支持与GIS系统集成,实现温度异常的空间分布可视化,而邻近城市关联信息则有助于构建区域气候网络分析模型。
背景与挑战
背景概述
城市温度异常数据集作为气候科学领域的重要资源,聚焦于全球城市热岛效应与气候变化研究。该数据集由伯克利地球研究团队于21世纪初构建,整合了全球多国气象站观测数据,通过计算温度异常值揭示城市热环境演变规律。其核心研究问题在于量化工业革命以来城市地表温度相对于基准期的偏离程度,为理解人类活动对局地气候的影响提供实证依据,对城市规划与气候政策制定具有深远意义。
当前挑战
在解决城市热岛效应量化问题时,数据集面临温度观测站点空间分布不均与时间序列不完整的双重挑战。构建过程中需克服原始气象数据格式异构性问题,包括不同国家观测标准差异、仪器更替导致的系统误差,以及历史数据数字化缺失。此外,城市边界动态扩展与土地利用变化使得长期温度序列的归一化处理尤为复杂,需开发先进的空间插值算法来保证数据连续性。
常用场景
经典使用场景
在气候科学研究领域,该数据集通过多时间尺度的温度异常记录,为全球变暖趋势分析提供了关键支撑。其包含的月际、年际及五年至二十年尺度的温度异常数据,使研究人员能够构建精确的气候变化模型,特别适用于分析不同地理区域对全球变暖的响应差异。数据集涵盖的经纬度坐标与邻近城市信息,进一步强化了空间气候模式的识别能力,为区域气候比较研究奠定了数据基础。
衍生相关工作
基于该数据集衍生的经典研究包括城市热岛效应量化分析、区域气候敏感性评估框架构建等重要工作。学者们利用其多尺度温度异常数据,开发了新型的气候变化检测与归因方法,推动了极端温度事件预测模型的革新。相关研究成果已被联合国政府间气候变化专门委员会(IPCC)评估报告广泛引用,为全球气候治理政策制定提供了关键科学支撑,形成了完整的气候变化研究价值链。
数据集最近研究
最新研究方向
在全球气候变暖背景下,城市温度异常数据集正推动着气候科学的前沿探索。当前研究聚焦于利用多时间尺度异常数据构建高精度城市热岛效应模型,结合地理空间特征分析区域气候敏感性差异。随着极端天气事件频发,该数据集被广泛应用于评估城市气候韧性,为可持续发展政策提供量化依据。机器学习方法正被用于预测不同排放情景下的城市温度演变轨迹,这些成果对制定精准适应策略具有重要科学价值。
以上内容由遇见数据集搜集并总结生成



