five

Qdrant/NOAA-Buoy

收藏
Hugging Face2023-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Qdrant/NOAA-Buoy
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含NOAA浮标的气象数据,适用于表格嵌入场景。数据分为两部分:一部分是从1980年到2022年的数据,另一部分是从2023年1月到9月的数据。数据集主要用于表格数据的特征提取、分类和时间序列预测,特别是用于异常检测。数据经过清洗和处理,包括时间戳的创建、缺失数据的处理、不一致字段的修正等。
提供机构:
Qdrant
原始信息汇总

NOAA Buoy 气象数据

数据集描述

数据集详情

NOAA Buoy 数据是从1980年至2023年下载、处理和清洗的气象测量数据。数据集包括两个部分:

  1. 1980年至2022年的数据(文件名中标记为"years")
  2. 2023年1月至2023年9月的数据(文件名中标记为"2023")

数据集主要用于表格数据的异常检测。

数据字段

数据字段包括:

  • TSTMP: timestamp
  • #YY: #yr
  • MM: mo
  • DD: dy
  • hh: hr
  • mm: mn
  • WDIR: degT
  • WSPD: m/s
  • GST: m/s
  • WVHT: m
  • DPD: sec
  • APD: sec
  • MWD   : degT
  • PRES: hPa
  • ATMP: degC
  • WTMP: degC

数据集创建

数据处理

数据处理步骤包括:

  1. 将年、月、日、时、分拼接成时间戳并存储在新列中。
  2. 1980年至2005年没有分钟记录,这些年的分钟设置为00。
  3. 所有缺失数据设置为空白值。
  4. 删除所有缺少波浪数据的行。
  5. 删除因持续缺失值而被移除的列。
  6. 2005年至2006年,风向从WD改为WDIR。
  7. 2006年至2007年,标题从单行变量名改为两行,第二行为单位。

进一步处理

数据集进一步处理包括:

  1. 所有数据值转换为Z分数。
  2. 1980年至2022年,删除所有具有2个或更多字段Z分数大于2的行。

用途

直接用途

主要用于表格数据和嵌入,特别是异常检测。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作