psg-audio

Hugging Face2026-02-26 更新2026-02-27 收录

下载链接：

https://huggingface.co/datasets/dust-systems/psg-audio

下载链接

链接失效反馈

官方服务：

资源简介：

PSG-Audio数据集是一个包含305名阻塞性睡眠呼吸暂停患者整夜多导睡眠图（PSG）记录的镜像数据集，特别适合基于声音的睡眠分期研究。数据集包含欧洲数据格式（EDF）文件和多通道PSG记录，通常分为约5个一小时的部分，共20个通道，包括EEG、EOG、EMG、ECG、气流、SpO2、鼾声传感器和一个48kHz的床边麦克风。此外，数据集还包含基于XML的专家睡眠阶段注释（RML文件），每30秒为一个时期，标记为Wake、N1、N2、N3或REM。数据集总大小约586GB，包含约1,682个文件，其中191名受试者的EDF和RML文件对可用。音频通道为`Mic`（通道18，48kHz采样率），注释格式为30秒时期，5类（Wake/N1/N2/N3/REM）。数据集最初托管在scidb.cn上，此镜像为永久性存储以确保可重复性。数据集采用CC BY 4.0许可。

The PSG-Audio Dataset is a mirrored dataset containing overnight polysomnography (PSG) recordings from 305 patients with obstructive sleep apnea, which is particularly suitable for sound-based sleep staging research. The dataset includes European Data Format (EDF) files and multi-channel PSG recordings, which are typically split into approximately 5 one-hour segments, with a total of 20 channels covering EEG, EOG, EMG, ECG, airflow, SpO2, snore sensor, and a 48kHz bedside microphone. In addition, the dataset also contains XML-based expert sleep stage annotations (RML files), with each 30-second epoch labeled as Wake, N1, N2, N3, or REM. The total size of the dataset is approximately 586 GB, containing around 1,682 files, and paired EDF and RML files for 191 subjects are available. The audio channel is `Mic` (Channel 18, 48kHz sampling rate), and the annotation format follows 30-second epochs with 5 categories (Wake/N1/N2/N3/REM). The dataset was originally hosted on scidb.cn, and this mirror is permanently stored to ensure reproducibility. The dataset is licensed under CC BY 4.0.

创建时间：

2026-02-26

搜集汇总

数据集介绍

构建方式

在睡眠医学研究领域，PSG-Audio数据集通过整合多导睡眠图（PSG）与同步音频记录构建而成。该数据集源自阻塞性睡眠呼吸暂停患者，采集了全夜的生理信号，包括脑电图、眼电图、肌电图等20个通道，并以欧洲数据格式存储。专家依据30秒为周期对睡眠阶段进行标注，形成Wake、N1、N2、N3和REM五类标签，同时包含48kHz采样率的床边麦克风音频通道，为声音驱动的睡眠分期研究提供了关键数据基础。

特点

PSG-Audio数据集的特点在于其多模态融合与临床针对性。数据集不仅提供了高精度的生理信号，还整合了高质量的同步音频记录，特别适用于探索呼吸事件与声音特征之间的关联。数据规模庞大，总计约586GB，涵盖部分原始数据，虽为镜像版本，但仍保留了核心的标注文件和音频通道。其标注体系基于标准睡眠分期协议，确保了研究的一致性与可比性，为睡眠障碍的自动检测算法开发提供了丰富资源。

使用方法

使用PSG-Audio数据集时，研究人员可通过Python工具如pyedflib读取EDF文件，提取麦克风通道的音频数据及其48kHz采样率。睡眠阶段标注则利用lxml解析RML格式的XML文件，获取每30秒周期的分类标签。需注意区分EDF文件中的Snore传感器通道与真正的音频通道，避免误用。该数据集适用于音频分类、睡眠分期模型训练等任务，支持基于声音的睡眠呼吸暂停分析与算法验证，促进睡眠医学的智能化发展。

背景与挑战

背景概述

睡眠医学领域长期依赖多导睡眠监测（PSG）作为诊断睡眠障碍的金标准，然而传统PSG设备复杂且成本高昂，限制了其在广泛人群中的应用。在此背景下，PSG-Audio数据集于2021年由Korompili等人创建，旨在提供包含同步音频记录的全夜PSG数据，专门针对阻塞性睡眠呼吸暂停患者。该数据集的核心研究问题在于探索如何利用床边麦克风采集的音频信号，实现非侵入式、低成本的自动睡眠分期，从而推动睡眠监测技术的普及化与智能化。作为首个大规模公开的同步PSG与音频数据集，它为声音驱动的睡眠分析研究奠定了重要基础，显著促进了睡眠医学与计算听觉领域的交叉融合。

当前挑战

该数据集旨在解决睡眠分期自动化这一核心领域问题，其挑战在于如何从复杂的夜间环境音频中准确识别细微的生理声学特征，如呼吸声、鼾声及体动声，并将其映射到五个离散的睡眠阶段（清醒、N1、N2、N3、REM）。这要求模型具备强大的特征提取与抗干扰能力，以应对个体差异与背景噪声。在构建过程中，数据集面临数据完整性与可及性的双重挑战：原始数据通过有时限的FTP凭证托管，导致当前镜像仅包含约59%的文件，缺失部分包括大量原始多通道PSG记录（EDF文件）与清洗后的标注（RML文件），这为研究的可复现性与全面性带来了显著限制。

常用场景

经典使用场景

在睡眠医学与生物信号处理领域，PSG-Audio数据集为研究睡眠分期与呼吸障碍提供了关键资源。该数据集整合了多导睡眠图与同步音频记录，其经典应用场景在于开发基于声音的自动睡眠分期算法。研究者可利用48kHz床边麦克风通道捕捉的音频信号，结合专家标注的睡眠阶段标签，训练机器学习模型以非侵入方式识别睡眠阶段，从而减少对传统电极依赖，推动便捷化睡眠监测技术的发展。

衍生相关工作

围绕PSG-Audio数据集，已衍生出多项经典研究工作。例如，研究者利用其音频通道开发了深度学习模型，用于自动识别鼾声、呼吸暂停事件及睡眠阶段转换。这些工作不仅验证了音频信号在睡眠分析中的有效性，还推动了开源工具包的开发，促进了睡眠信息学领域的算法比较与标准化评估，为后续大规模睡眠音频研究奠定了坚实基础。

数据集最近研究