hi-21cm-survey
收藏数据集概述:21cm氢线全天巡天
基本描述
这是一个关于21厘米中性氢(HI)线的射电天文数据集。它包含了以1秒为时间分辨率连续记录的、频率为1420.405 MHz的功率谱数据。数据由一个固定在美国东海岸的全向观测站24/7不间断记录。
数据集详情
- 许可证:CC BY 4.0
- 任务类别:时间序列预测
- 标签:射电天文学、21cm、氢线、光谱巡天、银河系、银河系结构、漂移扫描、连续
- 数据规模:1M-10M
数据采集硬件与设置
- 天线:全向L波段馈源探头(宽波束,天顶偏向)
- 低噪声放大器:Nooelec SAWbird+ H1(SAW带通滤波器 + LNA,中心频率1420 MHz)
- 软件定义无线电:Nooelec SMArTee v5(RTL2832U + R820T,TCXO 0.5 ppm)
- 计算设备:Raspberry Pi 5,Debian系统,无头模式
- 地理位置:美国东海岸(41.0°N 73.0°W,量化坐标)
- 观测方法:地球自转使波束每天扫过银河平面,形成自然的漂移扫描。
数据模式
每行数据代表rtl_power的一个积分周期。
| 列名 | 类型 | 单位 | 描述 |
|---|---|---|---|
date |
字符串 | — | UTC日期(YYYY-MM-DD) |
time |
字符串 | — | UTC时间(HH:MM:SS) |
freq_start |
整数 | Hz | 频带下边缘(1419500000) |
freq_end |
整数 | Hz | 频带上边缘(1421500000) |
bin_width |
浮点数 | Hz | 频率分箱间距(约976.56) |
num_samples |
整数 | — | 此积分周期内平均的样本数 |
power_0..power_2048 |
浮点数 | dB | 每个频率分箱的功率谱密度 |
频率轴:2049个分箱,从1419.500 MHz到1421.500 MHz,间隔约976.56 Hz。重建公式:freq_mhz[i] = freq_start/1e6 + i * bin_width/1e6。
功率值:相对于SDR内部参考的对数尺度(dB)值。未经流量校准。相对测量(例如,开-关、时间差分)是有效的。
信号内容
信号主要包含来自银河系中性氢的21厘米谱线。银河平面包含大量处于不同距离和速度的HI气体云。银河系旋转产生的多普勒效应使每个气体云的发射频率发生轻微偏移,导致谱线在约400 kHz(约100 km/s)范围内展宽。主要特征包括:
- 本地/猎户臂 — 最近的气体,主导贡献,接近静止频率
- 英仙臂 — 红移(远离),频率较低
- 外臂 — 进一步红移
- 盾牌-半人马臂、人马-船底臂 — 银河系内部,速度结构复杂
随着地球自转使波束扫过不同的银经,信号强度和速度结构在一天内会发生变化。
校准说明
这是未经校准的数据。 功率值包含了接收机带通形状(SAWbird滤波器滚降)、增益漂移(热效应)和系统噪声。提取HI信号的方法:
- 地球自转“关”状态:当银河平面位于地平线以下时,可作为天然的带通参考。从“开”状态(平面可见时)的数据中减去。
- 多项式基线:对每个频谱拟合并减去带通形状,排除HI频率范围。
- 匹配滤波器:与银河系旋转模型进行互相关以获得最佳信噪比。
已知的伪影:
- SAWbird滤波器在2 MHz观测窗口内的带通斜率(低频处功率较高)
- 热增益漂移(数小时内约1–3 dB,与环境温度相关)
- 偶尔的射频干扰尖峰(窄带,可通过持续时间和带宽识别)
研究应用
- 银河系结构 — 通过速度分辨的HI发射进行旋臂的多普勒层析成像
- 漂移扫描绘图 — 地球自转提供完整的赤经覆盖;叠加多天数据以构建天图
- 射频干扰表征 — 城市附近L波段的长期干扰环境研究
- 接收机稳定性 — 数月内的热漂移、增益变化、带通演化
- 闪烁 — 以1秒分辨率研究致密HI特征的星际闪烁
- 教育 — 为学生提供易于获取的射电天文学数据集(无需望远镜即可分析)
数据收集方法
Raspberry Pi 5上的自动化守护进程:
rtl_power持续运行,积分时间为1秒- Python watchdog处理崩溃恢复、每日文件轮换、健康日志记录
- 通过
huggingface_hub每日上传至HuggingFace - 接收机设置:49.6 dB增益,2 MHz带宽,2048点FFT
引用方式
bibtex @dataset{hi-21cm-survey, title={21cm Hydrogen Line Sky Survey}, author={Norton, Charles C.}, year={2026}, publisher={Hugging Face}, url={https://huggingface.co/datasets/phanerozoic/hi-21cm-survey} }




