five

Lamb-Richman Dataset Extension

收藏
github2017-05-25 更新2024-05-31 收录
下载链接:
https://github.com/sethdeckard/Lamb-Richman-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
LR数据集扩展是一个生成或扩展Lamb-Richman数据集的库,使用来自美国(NOAA/NWS)和加拿大的COOP站数据。由俄克拉荷马大学气象学院的Peter Lamb博士和Michael Richman博士创建,该气候数据集提供了美国和加拿大东部落基山脉766个均匀网格点的最高/最低温度和降水数据。该数据集非常适合与气候科学相关的机器学习应用。该库将现有数据集(1949-2000)从2001年扩展到2010年,并可用于自动扩展其他年份或重新生成整个数据集。

The LR Dataset Extension is a library designed for generating or extending the Lamb-Richman dataset, utilizing data from COOP stations in the United States (NOAA/NWS) and Canada. Created by Dr. Peter Lamb and Dr. Michael Richman from the School of Meteorology at the University of Oklahoma, this climate dataset provides maximum/minimum temperature and precipitation data for 766 uniformly gridded points across the eastern Rocky Mountains of the United States and Canada. This dataset is particularly well-suited for machine learning applications related to climate science. The library extends the existing dataset (1949-2000) from 2001 to 2010 and can be used to automatically extend to other years or regenerate the entire dataset.
创建时间:
2014-01-08
原始信息汇总

数据集概述

名称: Lamb-Richman Dataset Extension

创建者: Dr. Peter Lamb 和 Dr. Michael Richman, 俄克拉荷马大学气象学院

数据来源: 美国(NOAA/NWS)和加拿大(可用时)的COOP站数据

覆盖区域: 美国和加拿大,落基山脉以东

数据内容: 提供766个均匀网格点的最高/最低温度和降水数据

时间范围: 原始数据集(1949-2000),扩展数据集(2001-2010)

应用: 适用于气候科学相关的机器学习应用

数据集功能: 自动化扩展数据集至额外年份或重新生成整个数据集

数据处理流程

  1. 导入主美国站列表(一次操作,包含站点位置)
  2. 导入主加拿大站列表(一次操作,包含站点位置)
  3. 导入先前导出的网格站信息(tmininfo.txt, tmaxinfo.txt, prcpinfo.txt)
  4. 导入美国COOP数据(TD3200格式)
  5. 导入加拿大原始数据
  6. 导出该年数据
  7. 重复步骤3-6以处理额外年份

项目结构

  • DataSetExtension: 核心库
  • DataSetExtension.Database: 包含数据库管理类(SQLite)
  • DataSetExtension.Import: 包含每种格式的导入类
  • DataSetExtension.ImportConsole: 辅助导入任务的控制台应用
  • DataSetExtension.ExportConsole: 辅助导出任务的控制台应用
  • DataSetExtension.Tests: 库的单元测试
  • DataSetExtension.ConsoleApp: 自动化整个过程的应用程序

特殊情况处理

  • 站点替换: 当COOP站数据缺失或标记为错误时,选择最近的有数据站点作为替代
  • 加拿大数据缺失: 由于预算削减,部分加拿大数据缺失,待在线可用后可重新处理这些年份的数据

构建与运行

  • 开发环境: 使用Mono在OS X上构建,理论上支持Windows但未测试
  • 数据存储: 使用SQLite和Dapper
  • 构建命令: ./build
  • 运行单元测试: ./tests
  • 控制台应用: 输出帮助信息以描述其使用方法
搜集汇总
数据集介绍
main_image_url
构建方式
Lamb-Richman Dataset Extension 是由Dr. Peter Lamb和Dr. Michael Richman创建的气候数据集的扩展库,利用美国(NOAA/NWS)和加拿大(在可用的情况下)的COOP站数据生成或扩展Lamb-Richman数据集。该过程涉及导入 stations 列表、网格站信息、处理单年的US COOP数据和Canada原始数据,然后导出数据,对于额外年份的处理,需重复相应步骤。
特点
该数据集提供了美国和加拿大落基山脉以东766个统一网格点的最高/最低温度和降水数据,非常适合气候科学相关的机器学习应用。库能够扩展现有数据集(1949-2000年)至2010年,并支持自动化扩展更多年份或重新生成整个数据集。数据集还包含站点的替代机制,以处理数据缺失或错误的情况。
使用方法
使用该数据集时,首先需要构建项目,可通过Mono在OS X上构建,理论上也应在Windows上工作,但未经测试。数据存储处理使用SQLite和Dapper。构建后,可通过运行console应用程序来自动化整个处理过程,并输出使用帮助信息。此外,项目提供了单元测试以验证库的功能。
背景与挑战
背景概述
Lamb-Richman Dataset Extension 数据集是由俄克拉荷马大学气象学院的Dr. Peter Lamb和Dr. Michael Richman创建的气候数据集扩展库。该数据集利用美国(NOAA/NWS)和加拿大(在可用的情况下)的COOP站点数据生成或扩展Lamb-Richman原始数据集,提供了美国和加拿大东部洛矶山脉以东766个统一网格点的最高/最低温度和降水量数据。该数据集自1949年至2000年,后经扩展至2010年,旨在为气候科学相关的机器学习应用提供理想的数据资源。
当前挑战
该数据集在构建过程中面临的挑战包括:数据完整性的处理,例如COOP站点某些日子的数据缺失或存在错误标志,需选取最近站点数据进行替代;加拿大数据的缺失问题,由于预算削减,部分年份的加拿大数据未能在线获取,尽管数据存储在备份磁带中,但需在线可用以便处理。此外,数据集的自动化扩展和完整性检查也是持续的挑战。
常用场景
经典使用场景
在气候科学领域,Lamb-Richman Dataset Extension数据集被广泛应用于机器学习模型训练。该数据集提供了美国和加拿大东部地区766个统一网格点上的最高/最低温度和降水量数据,为研究人员提供了一种便捷的方式,以进行气候变化趋势分析和气候模式预测。
实际应用
在实际应用中,Lamb-Richman Dataset Extension数据集可用于气候模型的校准和验证,为气候预报、灾害预警和农业规划等领域提供了数据支持。此外,该数据集对于政府决策者和环保组织在制定气候政策时也具有重要的参考价值。
衍生相关工作
基于Lamb-Richman Dataset Extension数据集,衍生出了一系列相关研究工作,包括气候变化的时空模式分析、极端气候事件预测模型的开发以及气候变化对生态系统影响的研究等,为气候科学领域的发展做出了积极贡献。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作