WasuratS/ECMWF_Thailand_Land_Air_Temperatures
收藏Hugging Face2023-05-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/WasuratS/ECMWF_Thailand_Land_Air_Temperatures
下载链接
链接失效反馈官方服务:
资源简介:
---
license: eupl-1.1
task_categories:
- time-series-forecasting
tags:
- climate
size_categories:
- 100M<n<1B
---
# Dataset Summary
Contains hourly 2 meters of land (on-shore) air temperature data within grid areas of Thailand country. <br/>
Data is retrieved from [Corpernicus Climate Data Store](https://cds.climate.copernicus.eu/cdsapp#!/home) on [ERA5-Land hourly data from 1950 to present](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview)
<br/>
Thailand areas in this context is **Latitude** = **[5.77434, 20.43353]** and **Longitude** = **[97.96852, 105.22908]** <br/>
For more details of data, you can refer to [ERA5-Land hourly data from 1950 to present](https://cds.climate.copernicus.eu/cdsapp#!/dataset/reanalysis-era5-land?tab=overview)
- Data Granularity: Hourly per Latitude/ Longitude
- Period: **31/Dec/1999** - **08/May/2023**
- Temperature Unit: Celsius (°C) (Original data from [ERA5-Land hourly data from 1950 to present](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview) is Kelvin)
# Source Data
- Organization of the producer: ECMWF
# Data Creation
Below is an example of how to make data query using Python via [CDS API](https://cds.climate.copernicus.eu/api-how-to) in monthly requests. <br/>
Script can be found [here](https://huggingface.co/datasets/WasuratS/ECMWF_Thailand_Land_Air_Temperatures/blob/main/cds_api_requestor_example.py)
``` python
import cdsapi
c = cdsapi.Client()
month_list = [str(num).zfill(2) for num in range(1, 13)]
day_list = [str(num).zfill(2) for num in range(1, 32)]
time_list = [str(num).zfill(2) + ":00" for num in range(0, 24)]
year_list = [str(num) for num in range(2000, 2022)]
for year in year_list:
for month in month_list:
c.retrieve('reanalysis-era5-land',
{
'variable': [
'2m_temperature']
,
'year': year,
'month' : month,
'day': day_list,
'time': time_list,
'format': 'grib',
'area': [
20.43, 97.96, 5.77,
105.22,
],
},
f'{year}_{month}_hourly_2m_temp_TH.grib')
```
Direct file output from API is in ```.grib``` format, to make it easy for further analysis work, I have converted it to ```.parquet``` format. <br/>
To convert GRIB format to pandas dataframe, you can use [xrray](https://github.com/pydata/xarray) and [cfgrib](https://github.com/ecmwf/cfgrib) library to help as below example snippet of code.
``` python
import xarray as xr
import cfgrib
ds = xr.open_dataset('2022_12_31_hourly_2m_temp_TH.grib', engine='cfgrib')
df = ds.to_dataframe().reset_index()
```
## Licensing
[Climate Data Store Product Licensing](https://cds.climate.copernicus.eu/api/v2/terms/static/licence-to-use-copernicus-products.pdf)
## Citation
- This data was generated using **Copernicus Climate Change Service** information and <br/>
contains modified **Copernicus Climate Change Service** information on 1999/Dec/31 - 2023/May/08 data period
- Muñoz Sabater, J. (2019): ERA5-Land hourly data from 1950 to present. <br/>
Copernicus Climate Change Service (C3S) Climate Data Store (CDS). <br/>
DOI: [10.24381/cds.e2161bac](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview) (Accessed on 13-May-2023)
- Copernicus Climate Change Service (C3S) (2022): ERA5-Land hourly data from 1950 to present. <br/>
Copernicus Climate Change Service (C3S) Climate Data Store (CDS). <br/>
DOI: [10.24381/cds.e2161bac](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview) (Accessed on 13-May-2023)
license: eupl-1.1
task_categories:
- 时间序列预测
tags:
- 气候
size_categories:
- 100M<n<1B
# 数据集概述
本数据集涵盖泰国网格范围内的陆上2米高度逐小时气温观测数据。
数据源自[哥白尼气候数据存储库](https://cds.climate.copernicus.eu/cdsapp#!/home)的[1950年至今的ERA5-Land逐小时数据集](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview)。
本文中泰国区域的**纬度**范围为**[5.77434, 20.43353]**,**经度**范围为**[97.96852, 105.22908]**。
如需了解更多数据细节,可参考[1950年至今的ERA5-Land逐小时数据集](https://cds.climate.copernicus.eu/cdsapp#!/dataset/reanalysis-era5-land?tab=overview)。
- 数据粒度:按经纬度网格的逐小时数据
- 时间范围:**1999年12月31日** - **2023年5月8日**
- 温度单位:摄氏度(℃)(原始数据源自[1950年至今的ERA5-Land逐小时数据集](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview),单位为开尔文)
# 源数据
- 数据生产方:欧洲中期天气预报中心(ECMWF)
# 数据构建
以下为通过[CDS API](https://cds.climate.copernicus.eu/api-how-to)以月度请求方式调用API获取数据的Python示例代码。
示例脚本可参见[此处](https://huggingface.co/datasets/WasuratS/ECMWF_Thailand_Land_Air_Temperatures/blob/main/cds_api_requestor_example.py)。
python
import cdsapi
c = cdsapi.Client()
month_list = [str(num).zfill(2) for num in range(1, 13)]
day_list = [str(num).zfill(2) for num in range(1, 32)]
time_list = [str(num).zfill(2) + ":00" for num in range(0, 24)]
year_list = [str(num) for num in range(2000, 2022)]
for year in year_list:
for month in month_list:
c.retrieve('reanalysis-era5-land',
{
'variable': [
'2m_temperature']
,
'year': year,
'month' : month,
'day': day_list,
'time': time_list,
'format': 'grib',
'area': [
20.43, 97.96, 5.77,
105.22,
],
},
f'{year}_{month}_hourly_2m_temp_TH.grib')
API直接输出的文件格式为`.grib`,为便于后续分析工作,本数据集已将其转换为`.parquet`格式。
若需将GRIB格式数据转换为Pandas数据框,可使用[xarray](https://github.com/pydata/xarray)与[cfgrib](https://github.com/ecmwf/cfgrib)库,示例代码如下:
python
import xarray as xr
import cfgrib
ds = xr.open_dataset('2022_12_31_hourly_2m_temp_TH.grib', engine='cfgrib')
df = ds.to_dataframe().reset_index()
# 许可协议
[哥白尼气候数据存储库产品许可协议](https://cds.climate.copernicus.eu/api/v2/terms/static/licence-to-use-copernicus-products.pdf)
# 引用说明
- 本数据集基于**哥白尼气候变化服务局(Copernicus Climate Change Service,C3S)**的信息生成,且包含1999年12月31日至2023年5月8日期间的**哥白尼气候变化服务局**修改后信息。
- Muñoz Sabater, J. (2019): 1950年至今的ERA5-Land逐小时数据集。
哥白尼气候变化服务局(C3S)气候数据存储库(CDS)。
DOI: [10.24381/cds.e2161bac](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview)(2023年5月13日访问)
- 哥白尼气候变化服务局(C3S)(2022): 1950年至今的ERA5-Land逐小时数据集。
哥白尼气候变化服务局(C3S)气候数据存储库(CDS)。
DOI: [10.24381/cds.e2161bac](https://cds.climate.copernicus.eu/cdsapp#!/dataset/10.24381/cds.e2161bac?tab=overview)(2023年5月13日访问)
提供机构:
WasuratS
原始信息汇总
数据集概述
数据集描述
- 内容: 包含泰国陆地(岸上)2米高度的每小时空气温度数据。
- 区域: 泰国,纬度范围 [5.77434, 20.43353],经度范围 [97.96852, 105.22908]。
- 数据来源: 从Corpernicus Climate Data Store获取,具体为ERA5-Land hourly data from 1950 to present。
- 时间范围: 1999年12月31日至2023年5月8日。
- 数据粒度: 每小时纬度/经度。
- 温度单位: 摄氏度(°C),原始数据单位为开尔文。
数据创建
- 数据查询示例: 使用Python通过CDS API进行每月请求。
- 文件格式转换: 原始API输出为
.grib格式,已转换为.parquet格式以方便进一步分析。
许可证
- 许可证: EUPL-1.1
引用信息
- 数据来源: Copernicus Climate Change Service信息,包含1999年12月31日至2023年5月8日数据期间的修改信息。
- 参考文献:
- Muñoz Sabater, J. (2019): ERA5-Land hourly data from 1950 to present. Copernicus Climate Change Service (C3S) Climate Data Store (CDS). DOI: 10.24381/cds.e2161bac (Accessed on 13-May-2023)
- Copernicus Climate Change Service (C3S) (2022): ERA5-Land hourly data from 1950 to present. Copernicus Climate Change Service (C3S) Climate Data Store (CDS). DOI: 10.24381/cds.e2161bac (Accessed on 13-May-2023)
搜集汇总
数据集介绍

构建方式
该数据集通过欧洲中期天气预报中心(ECMWF)的Copernicus Climate Data Store获取,涵盖了泰国地区1950年至今的每小时2米地表气温数据。数据以经纬度网格形式存储,时间跨度为1999年12月31日至2023年5月8日。原始数据以GRIB格式存储,后转换为Parquet格式以便于分析。数据获取过程通过Python脚本实现,利用CDS API按月请求数据,并转换为适合进一步分析的格式。
特点
该数据集以每小时为单位记录了泰国地区2米高度的地表气温,数据覆盖范围广泛,时间跨度长达二十余年。数据以经纬度网格形式呈现,便于进行空间和时间维度的分析。此外,数据集经过格式转换,从GRIB格式转换为Parquet格式,显著提升了数据处理的效率。数据集的高时间分辨率和空间覆盖范围使其成为气候研究和时间序列预测的理想选择。
使用方法
该数据集的使用方法包括通过Python脚本从Copernicus Climate Data Store获取数据,并将其转换为Parquet格式以便于分析。用户可以利用xarray和cfgrib库将GRIB格式数据转换为Pandas DataFrame,从而进行进一步的数据处理和分析。数据集适用于气候模型验证、时间序列预测以及区域气候变化的深入研究。
背景与挑战
背景概述
WasuratS/ECMWF_Thailand_Land_Air_Temperatures数据集由欧洲中期天气预报中心(ECMWF)提供,涵盖了泰国地区自1999年12月31日至2023年5月8日每小时的地表2米气温数据。该数据集源自ERA5-Land再分析数据,旨在为气候研究、气象预测及相关领域提供高精度的气温数据支持。通过Copernicus Climate Data Store获取的原始数据以Kelvin为单位,经过转换后以Celsius呈现,数据格式为.parquet,便于进一步分析。该数据集的创建不仅为泰国地区的气候变化研究提供了重要数据基础,也为全球气候模型的验证与改进提供了有力支持。
当前挑战
该数据集在解决气候预测与分析的挑战中,面临多方面的困难。首先,气候数据的时空复杂性要求高精度的数据处理与模型构建,尤其是在泰国这种地理与气候多样性显著的地区。其次,数据获取与转换过程中,原始GRIB格式的数据需要经过复杂的处理步骤才能转换为易于分析的.parquet格式,这对数据处理工具与技术的依赖性较高。此外,数据的长期性与高频性使得存储与计算资源的需求显著增加,如何在有限资源下高效处理与分析大规模数据成为一大挑战。最后,数据的准确性与一致性依赖于ERA5-Land再分析数据的质量,任何数据源的偏差或误差都可能对研究结果产生深远影响。
常用场景
经典使用场景
在气候科学研究中,WasuratS/ECMWF_Thailand_Land_Air_Temperatures数据集被广泛应用于时间序列预测任务。该数据集提供了泰国地区每小时的地表空气温度数据,覆盖了从1999年12月31日至2023年5月8日的时间段。研究人员利用这些高分辨率数据,能够深入分析泰国地区的气候变化趋势,预测未来的温度波动,并为区域气候模型的验证和优化提供重要依据。
实际应用
在实际应用中,WasuratS/ECMWF_Thailand_Land_Air_Temperatures数据集为泰国地区的农业规划、水资源管理和灾害预警系统提供了重要支持。通过分析历史温度数据,农业专家可以优化作物种植时间,提高产量;水资源管理者能够更好地预测干旱和洪水风险;而灾害预警系统则能够提前发出极端天气警报,减少灾害带来的损失。
衍生相关工作
基于该数据集,许多经典的气候研究工作得以展开。例如,研究人员利用这些数据开发了新的时间序列预测算法,提高了区域气候模型的精度。此外,该数据集还被用于研究泰国地区的气候变化对生态系统的影响,推动了气候适应策略的制定。这些研究工作不仅丰富了气候科学领域的知识体系,还为全球气候变化研究提供了宝贵的区域案例。
以上内容由遇见数据集搜集并总结生成



