five

hi-21cm-survey

收藏
Hugging Face2026-02-13 更新2026-02-14 收录
下载链接:
https://huggingface.co/datasets/phanerozoic/hi-21cm-survey
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为'21cm氢原子谱线天空巡天',包含以1秒为间隔连续记录的1420.405 MHz处21cm中性氢(HI)谱线的功率谱数据。数据采集自美国东海岸一个固定全向观测点,24/7不间断记录。 数据集内容: - 每行数据代表一个积分周期(1秒)的功率谱 - 频率范围:1419.500 MHz至1421.500 MHz,共2049个频点 - 主要包含银河系中中性氢气体产生的21cm谱线信号 - 数据未经过流量校准,包含接收机带通形状和系统噪声 数据字段: - 日期时间(UTC格式) - 频率范围起止点 - 频率分档宽度 - 积分样本数 - 2049个功率谱密度值(dB为单位) 硬件配置: - 全向L波段馈源探头 - Nooelec SAWbird+ H1低噪声放大器 - Nooelec SMArTee v5软件定义无线电 - 树莓派5计算平台 应用场景: - 银河系结构研究(通过多普勒层析成像) - 漂移扫描天空制图 - L波段射频干扰特征研究 - 接收机稳定性分析 - 星际闪烁研究 - 天文教育用途 数据采集方法: - 使用rtl_power连续采集,1秒积分时间 - Python看门狗程序处理故障恢复和日志记录 - 每日自动上传至HuggingFace平台
创建时间:
2026-02-12
原始信息汇总

数据集概述:21cm氢线全天巡天

基本描述

这是一个关于21厘米中性氢(HI)线的射电天文数据集。它包含了以1秒为时间分辨率连续记录的、频率为1420.405 MHz的功率谱数据。数据由一个固定在美国东海岸的全向观测站24/7不间断记录。

数据集详情

  • 许可证:CC BY 4.0
  • 任务类别:时间序列预测
  • 标签:射电天文学、21cm、氢线、光谱巡天、银河系、银河系结构、漂移扫描、连续
  • 数据规模:1M-10M

数据采集硬件与设置

  • 天线:全向L波段馈源探头(宽波束,天顶偏向)
  • 低噪声放大器:Nooelec SAWbird+ H1(SAW带通滤波器 + LNA,中心频率1420 MHz)
  • 软件定义无线电:Nooelec SMArTee v5(RTL2832U + R820T,TCXO 0.5 ppm)
  • 计算设备:Raspberry Pi 5,Debian系统,无头模式
  • 地理位置:美国东海岸(41.0°N 73.0°W,量化坐标)
  • 观测方法:地球自转使波束每天扫过银河平面,形成自然的漂移扫描。

数据模式

每行数据代表rtl_power的一个积分周期。

列名 类型 单位 描述
date 字符串 UTC日期(YYYY-MM-DD)
time 字符串 UTC时间(HH:MM:SS)
freq_start 整数 Hz 频带下边缘(1419500000)
freq_end 整数 Hz 频带上边缘(1421500000)
bin_width 浮点数 Hz 频率分箱间距(约976.56)
num_samples 整数 此积分周期内平均的样本数
power_0..power_2048 浮点数 dB 每个频率分箱的功率谱密度

频率轴:2049个分箱,从1419.500 MHz到1421.500 MHz,间隔约976.56 Hz。重建公式:freq_mhz[i] = freq_start/1e6 + i * bin_width/1e6

功率值:相对于SDR内部参考的对数尺度(dB)值。未经流量校准。相对测量(例如,开-关、时间差分)是有效的。

信号内容

信号主要包含来自银河系中性氢的21厘米谱线。银河平面包含大量处于不同距离和速度的HI气体云。银河系旋转产生的多普勒效应使每个气体云的发射频率发生轻微偏移,导致谱线在约400 kHz(约100 km/s)范围内展宽。主要特征包括:

  • 本地/猎户臂 — 最近的气体,主导贡献,接近静止频率
  • 英仙臂 — 红移(远离),频率较低
  • 外臂 — 进一步红移
  • 盾牌-半人马臂、人马-船底臂 — 银河系内部,速度结构复杂

随着地球自转使波束扫过不同的银经,信号强度和速度结构在一天内会发生变化。

校准说明

这是未经校准的数据。 功率值包含了接收机带通形状(SAWbird滤波器滚降)、增益漂移(热效应)和系统噪声。提取HI信号的方法:

  1. 地球自转“关”状态:当银河平面位于地平线以下时,可作为天然的带通参考。从“开”状态(平面可见时)的数据中减去。
  2. 多项式基线:对每个频谱拟合并减去带通形状,排除HI频率范围。
  3. 匹配滤波器:与银河系旋转模型进行互相关以获得最佳信噪比。

已知的伪影:

  • SAWbird滤波器在2 MHz观测窗口内的带通斜率(低频处功率较高)
  • 热增益漂移(数小时内约1–3 dB,与环境温度相关)
  • 偶尔的射频干扰尖峰(窄带,可通过持续时间和带宽识别)

研究应用

  1. 银河系结构 — 通过速度分辨的HI发射进行旋臂的多普勒层析成像
  2. 漂移扫描绘图 — 地球自转提供完整的赤经覆盖;叠加多天数据以构建天图
  3. 射频干扰表征 — 城市附近L波段的长期干扰环境研究
  4. 接收机稳定性 — 数月内的热漂移、增益变化、带通演化
  5. 闪烁 — 以1秒分辨率研究致密HI特征的星际闪烁
  6. 教育 — 为学生提供易于获取的射电天文学数据集(无需望远镜即可分析)

数据收集方法

Raspberry Pi 5上的自动化守护进程:

  • rtl_power持续运行,积分时间为1秒
  • Python watchdog处理崩溃恢复、每日文件轮换、健康日志记录
  • 通过huggingface_hub每日上传至HuggingFace
  • 接收机设置:49.6 dB增益,2 MHz带宽,2048点FFT

引用方式

bibtex @dataset{hi-21cm-survey, title={21cm Hydrogen Line Sky Survey}, author={Norton, Charles C.}, year={2026}, publisher={Hugging Face}, url={https://huggingface.co/datasets/phanerozoic/hi-21cm-survey} }

搜集汇总
数据集介绍
main_image_url
构建方式
在射电天文学领域,中性氢21厘米谱线观测是揭示银河系结构的重要手段。本数据集通过一套固定于美国东海岸的全向天线系统,采用连续漂移扫描技术构建而成。硬件配置包括宽波束L波段馈源探头、带通滤波器与低噪声放大器组合的SAWbird+ H1模块,以及配备高稳定度温补晶振的RTL-SDR接收机。数据采集由树莓派5控制,通过rtl_power工具以每秒一次的频率持续记录以1420.405MHz为中心的2MHz带宽功率谱,形成时间跨度连续、空间覆盖完整的观测序列。
特点
该数据集的核心特征体现在其高时间分辨率与长期连续性上,每秒一条谱线的采集频率为研究星际闪烁等快速现象提供了可能。数据包含2049个频率通道,覆盖约400kHz的多普勒展宽范围,能够分辨银河系不同旋臂结构的速度分量。未校准的功率值保留了接收机带通响应与热漂移特性,使得数据集既可用于中性氢信号提取,也能服务于接收机稳定性分析与射频干扰特征研究。地球自转带来的天然漂移扫描机制,实现了对银河系不同经度区域的系统性覆盖。
使用方法
研究人员可通过Hugging Face数据集库直接加载数据,利用Python环境进行谱线分析与可视化。基础处理包括重构频率轴、绘制瞬时功率谱,以及通过日期时间字段进行数据切片。科学应用需采用差分处理技术:利用银河平面低于地平线的时段作为本底参考,通过多项式拟合扣除带通基线,再结合匹配滤波方法增强信噪比。数据集支持按小时分组统计,可用于构建日变化模式,或通过多日数据叠加生成天空映射图,适用于银河系结构反演、长期射频环境监测等研究场景。
背景与挑战
背景概述
中性氢21厘米谱线观测是射电天文学中探索银河系结构与动力学的经典手段,其原理基于氢原子基态超精细结构跃迁产生的特征辐射。该数据集由研究者Charles C. Norton于2026年构建并发布,旨在通过固定全向天线与软件定义无线电设备,实现对银河系中性氢气体的连续、高时间分辨率监测。其核心科学问题聚焦于利用地球自转带来的自然漂移扫描,以秒级采样率捕获银河系不同经度区域的氢线谱轮廓,从而解析旋臂结构、气体运动学及星际介质特性。这一长期、开放的观测计划为星系天文学、射电技术验证及天文教育提供了宝贵的时序数据资源。
当前挑战
该数据集致力于解决银河系中性氢气体分布与速度场的动态映射问题,其挑战在于从高噪声、未定标的原始功率谱中分离微弱的氢线信号,并克服接收机带通响应、热增益漂移及射频干扰等系统效应。构建过程中的挑战包括维持低成本硬件系统的长期稳定性,实现24/7连续数据采集与自动上传,以及设计有效的校准流程以消除带通倾斜和温度相关漂移,确保数据在相对测量中的科学可用性。
常用场景
经典使用场景
在射电天文学领域,中性氢21厘米谱线是探测银河系星际介质分布与运动的关键探针。该数据集以其连续一秒时间分辨率的高频谱记录,为研究人员提供了对银河系中性氢气体进行速度分辨成像的独特资源。经典使用场景包括利用地球自转产生的自然漂移扫描,通过日复一日的观测数据叠加,重构出银河系旋臂结构的二维乃至三维分布图。这种长时间、高时间分辨率的连续观测模式,使得细致研究星际介质的动态变化成为可能,例如追踪局部气体云的短期演化或探测星际闪烁现象。
解决学术问题
该数据集有效应对了射电天文观测中几个核心学术挑战。它通过提供长期、连续的未校准原始数据,为研究接收机系统稳定性、热增益漂移以及带通演化提供了实证基础,有助于改进观测系统的校准模型。在科学问题层面,数据集支持对银河系旋臂结构进行多普勒层析成像,通过分析不同速度成分的中性氢发射,解析近处猎户臂与远处英仙臂等结构的距离与运动信息。此外,其一秒时间分辨率使得探测快速变化的星际闪烁成为可能,为研究星际介质的湍动特性开辟了新途径。
衍生相关工作
基于该数据集的特性和内容,预期将衍生出一系列相关研究工作。在数据处理方法学上,可能催生针对低成本接收机未校准数据的自动化处理流程,包括高效的带通拟合与扣除算法、基于地球自转的自然背景扣除技术,以及用于微弱信号提取的优化匹配滤波器设计。在科学研究方面,利用其高时间分辨率特性,可开展对中性氢谱线短期变化的研究,探索星际闪烁的物理机制。此外,通过整合多日数据构建全天或特定银经区域的天空图,相关工作可进一步约束银河系旋臂的结构模型与运动学参数。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作