MyHeartCounts Datasets & Benchmarks

github2026-05-07 更新2026-05-09 收录

下载链接：

https://github.com/AshleyLab/myheartcounts-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

来自真实世界心血管队列的可穿戴传感器数据，包含三个基准测试轨道：结果预测、插补和预测。

Wearable sensor data collected from a real-world cardiovascular cohort includes three benchmark tracks: outcome prediction, imputation, and prediction.

创建时间：

2026-04-29

原始信息汇总

数据集概述

OpenMHC 是一个面向可穿戴传感器数据的基准测试平台，专注于真实世界心血管队列的开放研究。

核心任务

基准赛道：包含三个评测任务：
1. 结局预测（Track 1 – Encoder）：基于传感器数据预测临床结局。
2. 数据填补（Track 2 – Imputer）：对缺失的传感器通道进行插补。
3. 时间预测（Track 3 – Forecaster）：基于历史序列预测未来传感器读数。

数据与下载

数据集版本：提供 tiny 版本（小规模子集，用于快速测试和评审）。
下载方式：通过 Python 包 openmhc 的 download_dataset(version="tiny") 函数获取。
完整参与者数据需参考 DATASET.md 中的独立下载说明。

代码与使用

安装要求：Python ≥ 3.10，通过 pip install -e . 安装 openmhc 包及评估依赖。
模型接口：无需继承父类，只需实现对应协议的 duck-typed 方法：
- 结局预测：实现 encode 方法（输入张量形状 (B, 168, 38)，返回 (B, D) 嵌入）。
- 数据填补：实现 fit 和 impute 方法。
- 时间预测：实现 predict 方法（输入形状 (n_channels, history_length)，返回 (n_channels, horizon)）。
快速入门：Jupyter 笔记本 notebooks/quickstart.ipynb 提供完整示例。

提交与排行榜

提交方式：通过 GitHub Issues 提交，使用 to_submission_yaml() 生成 YAML 格式的提交内容。
评测协议：必须遵循标准协议（相同的划分文件、掩码配置和标签有效性标准）。
成绩计算：
- Track 1 & 3：由维护者根据原始指标计算全局得分（如平均 AUROC）。
- Track 2：本地计算技能分数和按类别细分分数（基于冻结的 LOCF 基线）。
排行榜：托管于 https://myheartcounts.stanford.edu/benchmark，HuggingFace Space 自动合并提交并重建。

仓库结构

路径	内容
`src/openmhc/`	公共 API（`evaluate_prediction`, `download_dataset` 等）
`src/downstream_evaluation/`	结局预测内部实现（线性探针、时间窗口选择、指标）
`src/imputation_evaluation/`	数据填补内部实现（掩码场景、逐通道指标）
`src/forecasting_evaluation/`	时间预测内部实现（窗口缓存、点指标与分位数指标）
`src/labels/`	标签注册表与类型查询
`data/labels/`	模式化注册文件（标签类型、有序词汇、有效性配置）
`notebooks/quickstart.ipynb`	端到端使用示例
`.github/ISSUE_TEMPLATE/submission.yml`	排行榜提交表单

许可与引用

代码：MIT 许可。
数据集：受单独的 Data Use Agreement 管理（详见 DATASET.md）。
论文：OpenMHC: Accelerating the Science of Wearable Foundation Models（NeurIPS 2026 Datasets and Benchmarks）。
引用格式： bibtex @inproceedings{openmhc2026, title = {OpenMHC: Accelerating the Science of Wearable Foundation Models}, author = {MyHeartCounts Team}, booktitle = {NeurIPS Datasets and Benchmarks}, year = {2026} }

搜集汇总

数据集介绍

构建方式

MyHeartCounts数据集源于一项针对真实世界心血管队列的可穿戴传感器研究，其构建过程严谨而细致。该数据集涵盖了来自参与者腕部设备采集的连续生理信号，包括心率、加速度计等多模态时间序列数据，并同步收集了丰富的临床结局标签。为确保数据质量与隐私合规，原始信号经过严格的去标识化、噪声过滤与时间对齐处理，最终形成以周为单位的标准化张量格式（每周168小时，38个通道）。数据集被划分为训练、验证与测试子集，并配备了统一的掩码配置与标签有效性准则，为三项基准任务——结局预测、数据填补与时序预测——提供了标准化评估框架。

特点

该数据集的核心特点在于其真实世界的大规模纵向采集特性，克服了传统实验室研究在生态效度上的局限。数据集中包含了缺失值、运动伪影等真实噪声，更贴近临床实际应用场景。其独特的三轨基准设计——结局预测采用线性探针评估表征质量，数据填补模拟不同稀疏程度的缺失模式，时序预测则关注多步前向推断——为可穿戴基础模型的通用性评估提供了多维度的挑战。此外，数据集的版本控制机制（如精简版“tiny”用于快速原型验证）与标准化评估协议，确保了算法比较的公平性与可复现性。

使用方法

研究者可通过Python包openmhc便捷地接入该数据集。首先执行openmhc.download_dataset(version="tiny")获取精简版本进行快速验证。对于结局预测任务，需实现Encoder协议，返回固定维度的周级表征向量；数据填补任务则要求实现Imputer协议，根据观测掩码恢复缺失通道；时序预测任务需实现Forecaster协议，仅基于历史窗口输出未来时段的信号。三项任务分别通过openmhc.evaluate_prediction、evaluate_imputation与evaluate_forecasting函数进行评估，生成包含全局分数（如平均AUROC）和子组指标的摘要结果。最终可通过results.to_submission_yaml生成标准格式的提交文件，上传至在线排行榜参与公平竞技。

背景与挑战

背景概述

MyHeartCounts Datasets & Benchmarks（简称MHC D&B）是由斯坦福大学Ashley实验室主导构建的公开基准数据集，旨在推动可穿戴设备基础模型在心血管健康领域的科学研究。该数据集于2026年NeurIPS大会发布，核心研究问题聚焦于利用真实世界可穿戴传感器数据（来自心血管疾病队列）解决三大基准任务：健康结局预测、数据缺失补全及时间序列预测。通过提供标准化的评估协议与排行榜，MHC D&B为可穿戴健康大模型的性能可重复性评估树立了标杆，填补了真实临床场景下多模态时序数据建模与评估的空白，对促进心脑血管疾病智能预警及个性化健康管理具有里程碑意义。

当前挑战

MHC D&B面临的挑战主要源于真实临床数据的复杂性与任务多样性。在领域问题层面，可穿戴传感器数据常存在高噪声、非平稳性及个体异质性，影响结局预测模型的泛化能力；缺失补全任务需应对临时性传感器中断导致的非随机缺失模式，而多步预测需捕捉生理信号的长期依赖关系。在构建过程中，数据集面临真实世界数据标注稀疏与标签不确定性的制约，需设计严格的标签有效性准则；同时，为保障患者隐私，原始波形数据无法直接开放，仅提供符合规范的特征表征，这给底层模型复现带来额外挑战。此外，多任务评估框架的兼容性与基线方法的设计亦需平衡计算效率与临床可解释性。

常用场景

经典使用场景

在可穿戴传感器数据驱动的健康研究领域，MyHeartCounts Datasets & Benchmarks 提供了来自真实世界心血管队列的多模态时间序列数据，其经典使用场景聚焦于三大基准任务：结局预测、缺失值填补与时间序列预测。通过定义统一的评估协议和层次化指标，该数据集使研究者能够在同一标准下公平比较不同模型的性能。例如，研究者可利用用户每周的加速度计与心率数据，设计编码器提取表征，进而预测心血管相关临床结局；或借助缺失模式生成策略，训练填补模型还原不连续的传感器信号。这一设计极大推动了可穿戴基础模型从实验室验证迈向真实场景的可复现评估。

实际应用

在实际应用层面，MyHeartCounts 数据集所定义的基准任务直接映射至移动医疗与远程健康监测的核心场景。结局预测任务可支撑心血管风险早期预警系统的开发，使得可穿戴设备不再是单纯的数据记录工具，而是具备主动健康干预能力的智能终端；缺失值填补算法则保障了在用户佩戴不连续、信号干扰等现实条件下传感器数据的完整性，从而提升行为分析、用药依从性监测等应用的可信度；而时间序列预测能力则可用于未来体力活动水平或心率变异性趋势的推演，为个性化健康管理与运动推荐提供前瞻性见解。这些场景的实现不仅降低了传统临床研究的高昂成本，还拓展了人群健康监测的时空覆盖范围。

衍生相关工作

基于 MyHeartCounts 数据集的三大基准任务，该工作已催生一系列具有代表性的后续研究。在表征学习领域，研究者借鉴其结局预测评估协议，开发了面向多通道时序数据的对比预训练方法，并验证了其在少样本标签场景下的迁移优势；在缺失数据建模方向，出现了将扩散概率模型与可穿戴数据缺失模式相结合的新型填补框架，其性能显著超越传统 LOCF 基线；此外，基于该数据集的统一评估平台，还涌现出融合时间傅里叶变换与注意力机制的轻量化预测模型，专为资源受限的边缘设备设计。这些衍生工作不仅验证了数据集本身作为标尺的权威性，也彰显了其作为学术社区共享创新土壤的深远价值。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集