five

notadib/NASA-Power-Daily-Weather|气象数据数据集|地理信息数据集

收藏
hugging_face2024-07-12 更新2024-06-12 收录
气象数据
地理信息
下载链接:
https://hf-mirror.com/datasets/notadib/NASA-Power-Daily-Weather
下载链接
链接失效反馈
资源简介:
该数据集包含从NASA Power API下载的1984年1月1日至2022年12月31日的每日太阳能和气象数据。数据集覆盖了北美、中美洲和南美洲的5x8网格区域,每个网格矩形包含160个数据点,纬度和经度间隔为0.5度。数据集包含28个直接下载的变量和3个从收集数据中估计的变量。数据集的结构包括原始JSON格式数据、处理后的CSV格式数据以及用于训练的Pytorch TensorDataset对象。数据集的创建过程包括从NASA Power API获取数据、处理缺失值、省略闰年额外天数、数据透视以及标准化处理。

This dataset contains daily solar and meteorological data downloaded from the NASA Power API from January 1st, 1984, to December 31st, 2022. The dataset covers a 5x8 grid over North, Central, and South America, with each grid rectangle containing 160 data points spaced 0.5 degrees apart in latitude and longitude. The dataset includes 28 directly downloaded variables and 3 additional variables estimated from the collected data. The dataset structure includes raw JSON format data, processed CSV format data, and Pytorch TensorDataset objects ready for training. The dataset creation process involves data acquisition from the NASA Power API, handling missing values, omitting leap year extra days, pivoting data, and standardization.
提供机构:
notadib
原始信息汇总

数据集概述

数据集名称

NASA Power Weather Data over North, Central, and South America from 1984 to 2022

数据集内容

该数据集包含从1984年1月1日至2022年12月31日收集的太阳能和气象数据,涵盖北美、中美和南美地区。数据集包含31个气象变量,包括温度、风速、降水、云量等。

数据集结构

  • raw: 来自NASA Power API的未处理JSON格式数据。
  • csvs: 处理后的CSV格式数据。
  • pytorch: 准备用于训练的Pytorch TensorDataset对象,数据已重塑,序列长度为365。

数据集变量描述

参数名称 符号 单位
Temperature at 2 Meters T2M C
Temperature at 2 Meters Maximum T2M_MAX C
Temperature at 2 Meters Minimum T2M_MIN C
Wind Direction at 2 Meters WD2M Degrees
Wind Speed at 2 Meters WS2M m/s
Surface Pressure PS kPa
Specific Humidity at 2 Meters QV2M g/Kg
Precipitation Corrected PRECTOTCORR mm/day
All Sky Surface Shortwave Downward Irradiance ALLSKY_SFC_SW_DWN MJ/m^2/day
Evapotranspiration Energy Flux EVPTRNS MJ/m^2/day
Profile Soil Moisture (0 to 1) GWETPROF 0 to 1
Snow Depth SNODP cm
Dew/Frost Point at 2 Meters T2MDEW C
Cloud Amount CLOUD_AMT 0 to 1
Evaporation Land EVLAND kg/m^2/s * 10^6
Wet Bulb Temperature at 2 Meters T2MWET C
Land Snowcover Fraction FRSNO 0 to 1
All Sky Surface Longwave Downward Irradiance ALLSKY_SFC_LW_DWN MJ/m^2/day
All Sky Surface PAR Total ALLSKY_SFC_PAR_TOT MJ/m^2/day
All Sky Surface Albedo ALLSKY_SRF_ALB 0 to 1
Precipitable Water PW cm
Surface Roughness Z0M m
Surface Air Density RHOA kg/m^3
Relative Humidity at 2 Meters RH2M 0 to 1
Cooling Degree Days Above 18.3 C CDD18_3 days
Heating Degree Days Below 18.3 C HDD18_3 days
Total Column Ozone TO3 Dobson units
Aerosol Optical Depth 55 AOD_55 0 to 1
Reference evapotranspiration ET0 mm/day
Vapor Pressure VAP Pa
Vapor Pressure Deficit VAD Pa

数据集区域坐标

  • USA: 坐标范围从(29, -109)到(49, -69)。
  • Central America: 坐标范围从(24, -117)到(19, -77)。
  • South America: 坐标范围从(-51, -77)到(14, -85)。

数据处理

  • 缺失值通过回填处理。
  • 闰年的额外一天被省略,确保每年数据长度一致。
  • 数据进行了旋转,每个测量值有365、52或12列。
  • pytorch数据使用美国大陆的气象数据的均值和标准差进行了标准化。
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录

Tropicos

Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。

www.tropicos.org 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

TM-Senti

TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。

arXiv 收录