Qdrant/NOAA-Buoy
收藏Hugging Face2023-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Qdrant/NOAA-Buoy
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含NOAA浮标的气象数据,适用于表格嵌入场景。数据分为两部分:一部分是从1980年到2022年的数据,另一部分是从2023年1月到9月的数据。数据集主要用于表格数据的特征提取、分类和时间序列预测,特别是用于异常检测。数据经过清洗和处理,包括时间戳的创建、缺失数据的处理、不一致字段的修正等。
提供机构:
Qdrant
原始信息汇总
NOAA Buoy 气象数据
数据集描述
数据集详情
NOAA Buoy 数据是从1980年至2023年下载、处理和清洗的气象测量数据。数据集包括两个部分:
- 1980年至2022年的数据(文件名中标记为"years")
- 2023年1月至2023年9月的数据(文件名中标记为"2023")
数据集主要用于表格数据的异常检测。
数据字段
数据字段包括:
- TSTMP: timestamp
- #YY: #yr
- MM: mo
- DD: dy
- hh: hr
- mm: mn
- WDIR: degT
- WSPD: m/s
- GST: m/s
- WVHT: m
- DPD: sec
- APD: sec
- MWD : degT
- PRES: hPa
- ATMP: degC
- WTMP: degC
数据集创建
数据处理
数据处理步骤包括:
- 将年、月、日、时、分拼接成时间戳并存储在新列中。
- 1980年至2005年没有分钟记录,这些年的分钟设置为00。
- 所有缺失数据设置为空白值。
- 删除所有缺少波浪数据的行。
- 删除因持续缺失值而被移除的列。
- 2005年至2006年,风向从WD改为WDIR。
- 2006年至2007年,标题从单行变量名改为两行,第二行为单位。
进一步处理
数据集进一步处理包括:
- 所有数据值转换为Z分数。
- 1980年至2022年,删除所有具有2个或更多字段Z分数大于2的行。
用途
直接用途
主要用于表格数据和嵌入,特别是异常检测。



