中国气象站历史气象数据集
收藏github2025-11-05 更新2025-11-06 收录
下载链接:
https://github.com/ShoutaoChen/Weather-Data-Exporter-
下载链接
链接失效反馈资源简介:
该数据集包含中国1000多个气象站从1942年到2024年9月的历史气象数据,数据按年份组织在Database_CN文件夹中,包含28个气象参数,如温度、湿度、气压、风速、能见度等。数据文件以CSV格式存储,命名格式为[StationID]_[StationName]_[Country]_([Longitude],[Latitude]).csv,同时提供station_info.csv文件包含站点元数据信息。
This dataset contains historical meteorological data from over 1,000 meteorological stations across China, spanning from 1942 to September 2024. The data is organized by year and stored in the Database_CN folder. It includes 28 meteorological parameters such as temperature, relative humidity, atmospheric pressure, wind speed, visibility and other common meteorological indicators. All data files are stored in CSV format with the naming convention: [StationID]_[StationName]_[Country]_([Longitude],[Latitude]).csv. Additionally, a station_info.csv file is provided to store station metadata.
创建时间:
2025-11-04
原始信息汇总
Weather-Data-Exporter- 数据集概述
数据集基本信息
- 数据来源:中国1000多个气象站的历史气象数据
- 时间范围:1942年-2024年9月
- 数据格式:CSV、TXT
- 开发工具:MATLAB GUI应用程序
数据集结构
文件组织结构
Root Directory/ ├── Database_CN/ # 主数据库文件夹 │ ├── 1942/ # 年度文件夹(1942-2024) │ ├── 1943/ │ ├── ... │ └── 2024/ ├── station_info.csv # 站点元数据文件 ├── Data_explanation.xlsx # 原始数据说明文件 └── weather_data_exporter.m # 主MATLAB程序
数据文件命名规范
- 位置:Database_CN/[年份]/ 文件夹
- 命名格式:[站点ID][站点名称][国家]_([经度],[纬度]).csv
- 示例:59134099999_GAOQI_CHINA_(118.127739,24.544036).csv
数据内容
站点信息文件(station_info.csv)
包含以下元数据列:
- StationID:唯一站点标识符
- StationName:站点名称
- Longitude:地理经度(WGS84)
- Latitude:地理纬度(WGS84)
- FirstYear:站点最早可用数据年份
- LastYear:站点最新可用数据年份
可用气象参数
共支持28个气象参数导出:
| 编号 | 列名 | 描述 |
|---|---|---|
| 1 | STATION | 观测站ID |
| 2 | DATE | 观测日期 |
| 3 | LATITUDE | 纬度,WGS1984坐标(北为正,南为负) |
| 4 | LONGITUDE | 经度,WGS1984坐标(东为正,西为负) |
| 5 | ELEVATION | 海拔,单位:米 |
| 6 | NAME | 站点名称和国家代码 |
| 7 | TEMP | 平均温度;单位:华氏度;缺失值:9999.9 |
| 8 | TEMP_ATTRIBUTES | 平均温度的观测次数 |
| 9 | DEWP | 平均露点;单位:华氏度;缺失值:9999.9 |
| 10 | DEWP_ATTRIBUTES | 平均露点的观测次数 |
| 11 | SLP | 平均海平面气压;单位:毫巴/百帕;缺失值:9999.9 |
| 12 | SLP_ATTRIBUTES | 平均海平面气压的观测次数 |
| 13 | STP | 平均站点气压;单位:毫巴/百帕;缺失值:9999.9 |
| 14 | STP_ATTRIBUTES | 平均站点气压的观测次数 |
| 15 | VISIB | 平均能见度;单位:英里;缺失值:999.9 |
| 16 | VISIB_ATTRIBUTES | 平均能见度的观测次数 |
| 17 | WDSP | 平均风速;单位:节;缺失值:999.9 |
| 18 | WDSP_ATTRIBUTES | 平均风速的观测次数 |
| 19 | MXSPD | 最大持续风速;单位:节;缺失值:999.9 |
| 20 | GUST | 峰值阵风;单位:节;缺失值:999.9 |
| 21 | MAX | 最高温度;单位:华氏度;缺失值:9999.9 |
| 22 | MAX_ATTRIBUTES | 最高温度的观测次数 |
| 23 | MIN | 最低温度;单位:华氏度;缺失值:9999.9 |
| 24 | MIN_ATTRIBUTES | 最低温度的观测次数 |
| 25 | PRCP | 降水量;单位:英寸;缺失值:99.99 |
| 26 | PRCP_ATTRIBUTES | 降水量的观测次数 |
| 27 | SNDP | 雪深;单位:英寸;缺失值:999.9 |
| 28 | FRSHTT | 天气现象指示器:(1=发生,0=未发生或未报告)第1位:雾;第2位:雨/毛毛雨;第3位:雪/冰雹;第4位:雷暴;第5位:龙卷风/漏斗云 |
缺失值标识
- 温度参数:9999.9
- 风速和雪深:999.9
- 降水量:99.99
工具功能特性
核心功能
- 多站点支持:支持输入多个站点ID,用分号分隔
- 灵活数据选择:选择特定的气象数据列进行导出
- 自定义年份范围:为每个站点设置单独的年份范围或对所有站点使用相同范围
- 多种导出选项:导出为合并文件或每个站点的单独文件
- 格式支持:以CSV或TXT格式导出数据
- 数据预览:在导出前预览数据
输出格式
导出的数据包括:
- 前四列:StationID、Year、Month、Day
- 后续为选定的气象参数
- 原始数据中的日期列被拆分为单独的Year、Month、Day列
系统要求
- MATLAB R2018b或更高版本
AI搜集汇总
数据集介绍

构建方式
在气象观测领域,该数据集通过系统化整合中国境内逾千个气象站的历史记录构建而成,涵盖1942至2024年间的连续观测数据。数据以年度为单位分层存储于标准化目录结构中,每个气象站独立生成包含经纬度坐标的CSV文件,并配备元数据文件详细记录站点地理位置及数据时间跨度。原始观测值采用统一格式记录,针对不同气象参数设置了科学合理的缺测值标识机制,确保数据结构的规范性与完整性。
特点
该数据集最显著的特征在于其时空覆盖广度与多参数集成性,不仅囊括温度、气压、降水等28项核心气象要素,更以WGS84坐标系精准标注站点空间分布。数据采用分级存储架构,支持按年份快速检索,同时通过标准化命名规则实现站点标识与地理信息的无缝关联。特别值得注意的是,数据集针对不同物理量设置了差异化的缺测值编码体系,并保留观测次数元数据,为数据质量评估提供重要依据。
使用方法
基于MATLAB环境开发的图形化工具为数据提取提供便捷途径,用户可通过交互界面灵活选择目标站点组合与特定气象参数。系统支持自定义时间跨度配置,既可统一设定全局时间范围,也能为不同站点单独指定年份区间。在输出阶段提供合并文件与分站文件两种存储模式,并兼容CSV/TXT格式转换。数据预览功能允许用户在导出前验证数据结构和内容,确保科研分析的准确性。
背景与挑战
背景概述
中国气象站历史气象数据集作为覆盖1942至2024年的长期观测资料库,由气象科研机构通过整合全国逾千个气象站点构建而成。该数据集通过系统收录温度、降水、气压等28类气象要素,为气候变化分析、极端天气事件研究及区域气候模式验证提供了关键数据支撑,其时空连续性对理解东亚季风系统演变及人类活动对气候的影响具有重要科学价值。
当前挑战
在气象数据质量层面,该数据集面临观测系统迭代导致的标准不一致性,以及原始数据中温度参数采用华氏度、降水采用英寸的非国际单位制问题。数据构建过程中需克服历史纸质记录数字化产生的缺失值标记多样性(如999.9、99.99等特殊标识),同时需协调不同时期站点迁移或仪器更替引发的空间连续性断裂,这些因素共同制约着长期气候趋势分析的准确性。
常用场景
经典使用场景
在气候科学研究领域,中国气象站历史气象数据集凭借其覆盖全国千余站点、时间跨度长达八十余年的优势,成为分析区域气候演变规律的宝贵资源。该数据集常被用于构建长期气温序列、降水模式图谱及极端天气事件统计特征,为气候系统诊断和预测模型提供标准化输入。研究人员通过MATLAB工具链可高效提取多站点协同观测数据,揭示中国不同气候带的热力动力参数时空分异规律。
衍生相关工作
基于该数据集衍生的经典研究包括中国极端气温指数序列重建、东亚季风区降水格局变异分析等里程碑式成果。多个科研团队利用其开发的CMIP6模式检验框架已成为气候模拟评估的标准范式,由此产生的中国气候区划修订方案被纳入国家行业标准。在交叉学科领域,该数据集还催生了环境健康风险评价模型、文化遗产保存气候阈值确定等创新研究方向。
数据集最近研究
最新研究方向
在气候变化研究领域,中国气象站历史气象数据集凭借其跨越1942至2024年的连续观测记录,正成为极端天气事件归因分析的核心资源。近年来,学者们聚焦于利用该数据集构建高分辨率气候模型,通过整合温度、降水及风速等28项参数,揭示城市化进程对区域热岛效应的动态影响。随着碳中和目标的推进,该数据在可再生能源潜力评估中发挥关键作用,特别是结合地理信息系统对风能太阳能资源进行时空重构。此外,数据集的多站协同特性为东亚季风系统变异研究提供了新视角,推动气象灾害预警机制向智能化方向发展。
以上内容由AI搜集并总结生成



