PulseDB

github2025-02-27 更新2025-03-06 收录

下载链接：

https://github.com/AI4HealthUOL/ppg-ood-generalization

下载链接

链接失效反馈

官方服务：

资源简介：

PulseDB数据集用于训练和ID/OOD评估，基于不同的数据源（Vital, MIMIC, 或 Combined）定义了不同的子集，用于不同的训练场景，如Calib, CalibFree, 和AAMI-based子集。

The PulseDB dataset is designed for training and in-distribution (ID)/out-of-distribution (OOD) evaluation. It defines multiple subsets based on different data sources (Vital, MIMIC, or Combined), which are tailored for various training scenarios including the Calib, CalibFree, and AAMI-based subsets.

创建时间：

2025-02-26

原始信息汇总

数据集概述

数据集基本信息

数据集名称: PulseDB 和 BP-Benchmarking 数据集
研究主题: 基于光电容积描记术（PPG）的无创血压估计
研究论文: "Generalizable Deep Learning for Photoplethysmography-Based Blood Pressure Estimation – A Benchmarking Study"
作者: Mohammad Moulaeifard, Peter Charlton, 和 Nils Strodthoff

数据集组成

PulseDB 数据集 (Wang et al., 2023)
- 用途: 训练和分布内（ID）/分布外（OOD）评估
- 子集分类:
  - 数据来源: Vital, MIMIC, 或 Combined
  - 训练场景: Calib, CalibFree, 和 AAMI-based 子集
外部数据集 (González et al., 2023)
- 用途: OOD 评估
- 特点: 提供独立的无创血压估计基准，用于测试模型在分布外场景中的鲁棒性

数据处理与预处理

PulseDB 预处理
- 目标: 将数据集转换为机器可读格式
- 链接: PulseDB Preprocessing
外部数据集预处理
- 目标: 准备数据集用于测试
- 链接: External Dataset Preprocessing

模型训练与评估

训练模型
- 数据集: PulseDB 子集
- 训练场景: 包括校准策略和数据集分割的变体
- 链接: Training Models
权重域适应
- 目标: 通过权重调整提高模型鲁棒性
- 结果:
  - 平均改进（SBP）: 0.43 mmHg (ID/OOD), 3.39 mmHg (OOD)
  - 平均改进（DBP）: 0.31 mmHg (ID/OOD), 3.43 mmHg (OOD)
- 链接: Weighting Code

引用信息

bibtex @article{moulaeifard2025generalizable, title={Generalizable Deep Learning for Photoplethysmography-Based Blood Pressure Estimation – A Benchmarking Study}, author={Mohammad Moulaeifard, Peter H. Charlton, and Nils Strodthoff}, journal={arXiv preprint}, year={2025}, eprint={2502.19167}, archivePrefix={arXiv}, primaryClass={cs.LG} }

参考文献

PulseDB Dataset: Wang W, Mohseni P, Kilgore KL, Najafizadeh L. PulseDB: A large, cleaned dataset based on MIMIC-III and VitalDB for benchmarking cuff-less blood pressure estimation methods. Frontiers in Digital Health. 2023 Feb 8;4:1090854.
BP Benchmarking Dataset: González S, Hsieh WT, Chen TP. A benchmark for machine-learning based non-invasive blood pressure estimation using photoplethysmogram. Scientific Data. 2023 Mar 21;10(1):149.

搜集汇总

数据集介绍

构建方式

PulseDB数据集的构建基于Wang等人在2023年的工作，该数据集是由MIMIC-III和VitalDB整理而来，旨在为无创血压估计方法提供一个大型、清洗过的基准数据集。数据集根据数据源（Vital、MIMIC或组合）定义了不同的子集，并针对不同的训练场景（如Calib、CalibFree和基于AAMI的子集）进行构建，以供训练和ID/OOD评估使用。

特点

PulseDB数据集的特点在于其广泛的数据来源和多样的训练场景设计，这使得数据集不仅适用于常规训练，还能进行分布外泛化分析。数据集通过严格的预处理转换为机器可读格式，并包含用于评估模型性能的内部和外部数据集，其中外部数据集用于OOD评估，提供了独立的无创血压估计基准。

使用方法

使用PulseDB数据集首先需要进行预处理，以生成适用于训练的格式。之后，用户可以依据不同的训练场景，利用PulseDB的子集进行模型训练，并应用权重调整训练过程，以增强模型在不同领域间的鲁棒性和适应性。具体的使用步骤和代码指导可在数据集的GitHub仓库中找到。

背景与挑战

背景概述

PulseDB数据集，由Wang等人于2023年构建，是一项旨在为无创血压估计方法提供大规模、清洗过的基准数据集。该数据集整合了MIMIC-III和VitalDB的数据来源，其创建旨在为深度学习模型在光电容积描记图（Photoplethysmography, PPG）基础上进行血压估计提供基准测试。主要研究人员包括Mohammad Moulaeifard、Peter Charlton和Nils Strodthoff，他们的工作为无创血压估计领域提供了重要研究资源，并推动了该领域的发展。

当前挑战

该数据集在构建和应用过程中面临的挑战主要包括：1) 如何确保模型在不同数据分布上具有良好的泛化能力，特别是在Out-of-Distribution（OOD）场景下的表现；2) 数据预处理阶段的标准化和一致性，确保来自不同源的数据集能够有效融合；3) 对模型训练过程中的权重调整策略进行优化，以提高模型在不同领域中的适应性和鲁棒性。

常用场景

经典使用场景

PulseDB数据集作为深度学习模型训练的基础，其经典使用场景在于为基于光电容积描记图(Photoplethysmography, PPG)的无创血压估计算法提供了一组多样化的训练和验证数据。该数据集通过精心设计的子集划分，模拟了实际应用中可能遇到的各种数据分布情况，从而使得训练出的模型具备较强的泛化能力，能够适应不同的使用环境和条件。

解决学术问题

该数据集解决了传统无创血压估计算法在泛化能力上的局限性问题。通过提供不同来源和特性的数据子集，PulseDB使得研究者能够训练出在多样环境中表现稳定的模型，并评估其在不同分布数据上的性能，这对于提高无创血压监测技术的实用性和准确性具有重要的学术意义。

衍生相关工作

基于PulseDB数据集的研究已经衍生出一系列相关工作，包括对模型泛化能力的深入分析、权重调整策略的优化以及跨领域适应性的研究等。这些工作不仅进一步拓宽了无创血压估计领域的研究视野，也为深度学习在医疗健康领域的应用提供了新的方法和思路。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集