PulseLM

github2026-03-06 更新2026-03-06 收录

下载链接：

https://github.com/manhph2211/PulseLM

下载链接

链接失效反馈

官方服务：

资源简介：

PulseLM是一个多模态框架，集成了PPG（光电容积图）信号编码器与大型语言模型，用于生理信号理解研究。该项目包括一个大规模标准化的PPG数据集和一个模型架构，该架构通过LoRA微调将预训练的PPG编码器与LLM主干（LLaMA、Qwen变体）相结合。每个样本包含：一个10秒、125Hz、经过清理、处理和归一化的PPG信号；一个数据的文本描述（元数据、标签、地面信息、记录条件、传感器细节、活动等）；以及跨越12个临床相关类别/任务的问答对。该数据集支持PPG信号基础模型、多模态PPG语言对齐、零样本生理信号分类和可解释的健康监测AI等研究和应用。

PulseLM is a multimodal framework that integrates a photoplethysmography (PPG) signal encoder and a large language model (LLM), tailored for research on physiological signal understanding. This project encompasses a large-scale standardized PPG dataset and a model architecture that combines a pre-trained PPG encoder with LLM backbones (LLaMA, Qwen variants) via LoRA fine-tuning. Each sample includes: a 10-second, 125Hz PPG signal that has been cleaned, processed, and normalized; a textual description of the data (covering metadata, labels, ground truth, recording conditions, sensor specifications, activities, and other relevant details); and question-answer pairs spanning 12 clinically relevant categories or tasks. This dataset supports a wide range of research and applications, including PPG signal foundation models, multimodal PPG-language alignment, zero-shot physiological signal classification, and interpretable AI for health monitoring.

创建时间：

2026-02-10

原始信息汇总

PulseLM 数据集概述

数据集基本信息

数据集名称: PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning
核心内容: 一个用于PPG（光电容积描记法）信号与文本学习的大规模标准化多模态数据集及基准。
主要构成: 每个样本包含一段PPG信号、一段文本描述以及涵盖12个临床相关类别/任务的问答对。

数据样本详情

信号规格

信号类型: PPG（光电容积描记法）信号
信号时长: 10秒
采样频率: 125 Hz
处理状态: 经过清洗、处理和标准化

文本描述内容

文本描述总结并包含了以下信息：

临床元数据（如年龄、性别、BMI）
生理测量值（如心率、血压）
记录上下文（如活动状态、情绪状态）
信号特征
传感器细节（如记录位置：手腕、耳内）
医疗历史

问答对任务类别

数据集包含12个临床相关的问答任务类别，示例如下：

心率分类: 区分正常、心动过缓、心动过速。
血压分类: 区分正常、升高、高血压1期、高血压2期、高血压危象。
信号质量评估: 区分良好质量、噪声或失真、对称性异常。
情绪/压力状态: 区分基线、压力、愉悦、冥想。
睡眠呼吸障碍分类: 基于AHI区分正常、轻度、中度、重度。
心率变异性（SDNN）分类: 区分低、正常、高。
心率变异性（RMSSD）分类: 区分低、正常、高。
心率变异性（pNN50）分类: 区分低、正常、高。
心房颤动检测: 区分房颤、非房颤。
心律失常分类: 区分窦性心律、室性早搏、房性早搏、室性心动过速、室上性心动过速、房颤。
血氧饱和度（SpO2）分类: 区分正常、轻度低氧血症、中度低氧血症、重度低氧血症。
呼吸频率分类: 区分呼吸过缓、正常、呼吸过速。

数据集用途与研究领域

PPG信号基础模型研究
多模态PPG-语言对齐研究
生理信号零样本分类
健康监测的可解释人工智能

数据格式与加载

数据存储格式: .mat 文件
文件内容:
- signal: 存储PPG信号数据
- qa: 存储JSON格式的问答对数据
加载示例: 可使用scipy.io.loadmat加载，并将qa字段解析为JSON。

引用信息

如需使用本数据集，请引用以下论文：

@misc{pham2026pulselmfoundationdatasetbenchmark, title={PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning}, author={Hung Manh Pham and Jinyang Wu and Xiao Ma and Yiming Zhang and Yixin Xu and Aaqib Saeed and Bin Zhu and Zhou Pan and Dong Ma}, year={2026}, eprint={2603.03331}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2603.03331}, }

相关资源链接

论文地址: https://arxiv.org/abs/2603.03331
模型检查点: https://huggingface.co/Manhph2211/PulseLM

搜集汇总

数据集介绍

构建方式

在生理信号与自然语言处理的交叉领域，PulseLM数据集的构建体现了多模态融合的前沿理念。该数据集整合了来自多个公开PPG数据源的信息，通过系统化的预处理流程，将原始光电容积描记信号转化为标准化的10秒片段，采样频率为125赫兹，并进行了清洗与归一化处理。每个样本不仅包含经过处理的PPG波形，还精心配对了涵盖临床元数据、记录条件及传感器细节的文本描述，并围绕12个临床相关任务生成了结构化的问答对，从而构建了一个规模庞大且标准统一的跨模态基准数据集。

特点

PulseLM数据集的核心特征在于其首创的PPG-文本对齐架构，为生理信号理解研究提供了丰富的多模态资源。数据集中的每个样本均包含信号、文本描述与问答对三重信息，文本描述全面概括了受试者的人口统计学特征、生理指标及记录情境，而问答对则系统覆盖了心率分类、血压分级、信号质量评估、情绪状态识别及心律失常检测等12类临床任务。这种设计不仅支持端到端的多模态学习，还为零样本分类与可解释性健康监测研究奠定了坚实基础。

使用方法

为便于研究者高效利用该数据集，PulseLM提供了清晰的使用指引。用户可通过Python环境加载存储为.mat格式的数据文件，其中信号数据以数组形式保存，而问答对则以JSON字符串嵌入，解析后即可按类别访问问题与答案。该数据集适用于训练结合PPG编码器与大语言模型的多模态框架，支持基于LoRA的微调策略，可用于探索生理信号的基础模型构建、跨模态对齐及零样本推理等一系列前沿应用场景。

背景与挑战

背景概述

在可穿戴健康监测与人工智能交叉领域，光电容积脉搏波（PPG）信号因其无创、连续采集特性而成为生理信息分析的重要载体。然而，传统研究多聚焦于单一任务模型，缺乏能够统一理解PPG信号与丰富临床文本描述的大规模多模态基准。为此，研究人员于2026年提出了PulseLM数据集，该数据集由Hung Manh Pham、Jinyang Wu等学者联合构建，旨在为PPG-文本学习提供一个基础性资源。其核心研究问题在于探索如何通过大规模、标准化的PPG信号与对应文本描述（包括元数据、临床标签、记录条件等）及跨12个临床相关任务的问答对，来训练能够深入理解生理信号的多模态基础模型。这一工作有望推动PPG信号基础模型、多模态对齐、零样本生理信号分类及可解释健康监测等方向的发展，为下一代智能健康系统奠定数据基石。

当前挑战

PulseLM数据集致力于解决生理信号多模态理解这一前沿问题，其核心挑战在于如何实现PPG信号与自然语言文本的高效对齐与联合推理。具体而言，在领域问题层面，PPG信号本身易受运动伪影、个体生理差异及传感器噪声干扰，使得从中稳定提取具有判别性的高层语义特征（如情绪状态、心律失常类别）变得异常困难；同时，临床文本描述包含大量专业术语与复杂上下文，要求模型具备深厚的医学知识推理能力。在构建过程中，挑战主要源于数据整合与标注：需要从多个公开数据源中统一不同格式、采样率与质量的PPG信号，并进行严格的清洗与标准化；此外，为每个信号样本生成准确、全面的文本描述与多样化问答对，涉及大量跨学科专业知识，确保标注的一致性与临床有效性是一项繁重且易出错的任务。

常用场景

经典使用场景

在可穿戴健康监测与数字医疗领域，PulseLM数据集为光电容积描记信号与自然语言的跨模态学习提供了基准平台。其最经典的应用场景在于训练和评估能够理解PPG信号语义内涵的智能模型，通过将标准化的十秒PPG波形与丰富的文本描述及临床问答对相结合，研究者能够构建能够解析生理信号背后临床意义的智能系统。该数据集支撑着从信号分类到语义生成等一系列任务，为探索生理信号与语言之间的深层关联奠定了数据基础。

衍生相关工作

PulseLM作为基础性资源，已催生并支撑了一系列前沿研究工作。其多模态架构设计启发了结合预训练PPG编码器与大语言模型的新范式，相关研究专注于提升模型在有限标注数据下的泛化能力与临床可解释性。数据集构建过程中整合的多个公开PPG源，也促进了数据标准化与融合方法的发展。围绕其开展的基准测试，正推动着社区在PPG信号理解、多模态健康数据分析等方向形成统一的评估标准与创新浪潮。

数据集最近研究