L-FAME
收藏L-FAME: 纵向专注冥想脑电图数据集与基准
数据集概述
L-FAME(Longitudinal Focused Attention Meditation EEG Dataset and Benchmark)是一个包含64通道脑电图(EEG)数据的纵向数据集,旨在研究专注冥想(FAM)及其神经特征在六周训练期间的变化。数据集包含74名健康成年人的干预前基线记录,其中44人在六周后返回进行干预后随访。系统比较了三种专注冥想技术:哈瑞奎师那咒语(HK)、SA-TA-NA-MA咒语(SA)和呼吸专注(BF)。
该数据集随NeurIPS 2026数据集与基准赛道提交论文发布,定义了三个基准任务:(1)认知状态解码(休息 vs 冥想)、(2)细粒度技术分类(HK/SA/BF)以及(3)跨纵向间隔的跨会话适应。
数据集详情
核心特征
- 记录设备:64通道头皮脑电图,采样率250 Hz
- 数据格式:BIDS-EEG 1.9.0标准
- 会话结构:每名参与者两个会话(干预前和干预后,间隔六周)
- 任务片段:每个会话包含5个固定片段:
restOE(睁眼休息)- 120秒restCE01(闭眼休息,走神代理)- 240秒Medita(主动冥想)- 480秒restCE02(闭眼休息,主动后)- 240秒slMedita(静默/持续冥想)- 480秒
- 预处理层级:原始BIDS、EEGLAB清洗、机器学习就绪张量、机器学习连续数据
参与者人口统计
| 组别 | 专注对象 | 前测人数 | 后测人数 | 女性/男性 | 年龄(均值±标准差) |
|---|---|---|---|---|---|
| 呼吸专注(BF) | 呼吸 | 16 | 9 | 11/5 | 22.2 ± 3.9 |
| 哈瑞奎师那(HK) | 长咒语 | 31 | 19 | 18/13 | 22.2 ± 4.2 |
| SA-TA-NA-MA(SA) | 短咒语 | 27 | 16 | 17/10 | 21.7 ± 2.7 |
| 总计 | 74 | 44 | 46/28 | 22.0 ± 3.6 |
参与者流失率40.5%(30/74),经检验为完全随机缺失(MCAR)。
记录设置
- 放大器:mBrainTrain Smarting Pro X
- 电极帽:64通道EASYCAP,Ag/AgCl,扩展国际10-10布局
- 参考电极:FCz | 接地电极:FPz | 阻抗:< 20 kΩ
- 采样率:250 Hz | 电源频率:60 Hz
- 电解液:abralyt HiCl凝胶
- 电极数字化:CapTrak坐标系
存储库结构
| 层级 | 路径 | 格式 | 大小 | 用途 |
|---|---|---|---|---|
| 原始BIDS | sub-XX/ses-{premedita,posmedita}/eeg/*.{eeg,vhdr,vmrk,json,tsv} |
BrainVision | ~23 GB | 自行预处理 |
| EEGLAB清洗 | derivatives/eeglab_preproc/sub-XXX/ses-*/... |
EEGLAB | ~15 GB | MATLAB/MNE-Python管线 |
| 机器学习分段 | derivatives/ml_preproc_data/sub-XXX/.../*_eeg_preproc.npy |
NumPy float32 | ~11 GB | 基准代码使用的即用张量 |
| 机器学习连续 | derivatives/ml_continuous_tensors/sub-XXX/.../*_desc-icacleaned_continuous.npy |
NumPy float32 | ~11 GB | 自定义分段、滑动窗口或自监督预训练 |
注:原始BIDS根目录下主体ID为2位数字(
sub-01…sub-74),所有derivatives/层级下为3位数字(sub-001…sub-074)。
预处理细节
EEGLAB层级:
- 零相位1 Hz巴特沃斯高通滤波
- Zapline-plus 60 Hz线噪声去除
- 伪影子空间重建(ASR,突发标准差=25,最大坏道=0.2)
- 共平均重参考(含FCz,65通道)
- Infomax ICA → ICLabel(伪影阈值≥0.9)→ 成分去除
机器学习层级:
- 0.5 Hz FIR高通 + EEGLAB
clean_rawdata(空间相关0.9,线噪声4 SD) - 球面样条插值坏道
- 每片段输出为float32格式的(C×T)NumPy数组
机器学习连续层级:
- ICA清洗后的完整连续信号流(未分段),保存为
*_desc-icacleaned_continuous.npy
基准任务
| 任务 | 目标 | 输入片段 | 参与者数 | 评估方法 |
|---|---|---|---|---|
| 任务1 - 认知状态解码 | 休息(restCE01)vs 专注冥想(slMedita) |
仅干预前 | 74 | 受试者内(分块/时间顺序)、受试者间5折、留一法 |
| 任务2 - 技术分类 | 从slMedita(和/或Medita)中区分HK/SA/BF |
前测和后测分开 | 74(前测)/ 44(后测) | 受试者间5折 |
| 任务3 - 跨会话适应 | 将预训练的任务1模型应用于干预后数据 | 干预后 | 44 | 零样本和N样本校准 |
快速开始
数据集提供一键式封装函数 load_benchmark,处理数据下载、分窗、标签分配和交叉验证分割。
安装依赖
bash pip install -U huggingface_hub torch numpy pandas scikit-learn
运行基准任务示例
python from lfame import load_benchmark
任务1 - 认知状态解码
train, val, test = load_benchmark(task_id=1, cv_strategy="inter")
任务2 - 技术分类
train, val, test = load_benchmark(task_id=2, cv_strategy="inter", task2_session="pre")
任务3 - 跨会话适应,30样本校准
train, val, test = load_benchmark(task_id=3, cv_strategy="intra_30_shot", test_subject="12")
交叉验证策略
loso:留一法受试者inter:5折受试者间intra-block:20秒分块交替训练/测试intra-chrono:会话前80%训练,后20%测试intra-zero:零样本评估intra_{N}_shot:N样本校准(论文使用N=10和N=30)
默认窗长4秒@250 Hz,重叠率根据交叉验证策略不同(交叉受试者50%,所有intra-*策略87.5%)。
许可协议
本数据集采用CC BY-NC 4.0许可协议。允许出于非商业目的复制、分发、修改和基于此材料创作,但需适当署名。商业使用需获得作者明确书面许可。下载数据集即表示您同意不尝试重新识别任何参与者,并遵守适用的数据保护法规。
引用
bibtex @inproceedings{lfame2026, title = {L-FAME: Longitudinal Focused Attention Meditation EEG Dataset and Benchmark}, author = {<TODO: fill in author list at acceptance>}, booktitle = {Advances in Neural Information Processing Systems (NeurIPS) 39 — Datasets and Benchmarks Track}, year = {2026}, note = {Under review} }
版本历史
- v1.0 — 2026年5月 — 初始公开发布:74名受试者干预前队列,44名受试者干预后队列,三个衍生层级,三个基准任务定义。




