five

DLBS

收藏
Hugging Face2026-05-09 更新2026-05-10 收录
下载链接:
https://huggingface.co/datasets/chehablab/DLBS
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集源自达拉斯寿命大脑研究(DLBS),是一项涵盖成人寿命周期的纵向神经影像研究。研究整合了成人寿命周期内的大脑与认知数据,参与者年龄在21至89岁之间,每3.5至5年进行一次数据收集,共进行三轮。每轮数据收集包括T1加权图像、T2加权图像、功能MRI图像、动脉自旋标记(ASL)图像和扩散张量成像(DTI)图像。本数据集提供了从认知正常受试者所有可用轮次中提取的T1加权(T1w)和T2加权(T2w)MRI体积的2D切片版本。
创建时间:
2026-05-08
原始信息汇总

数据集概述:DLBS(Dallas Lifespan Brain Study)

基本信息

  • 数据集名称:DLBS
  • 来源:源自达拉斯寿命脑研究(Dallas Lifespan Brain Study, DLBS),是一项涵盖整个成人寿命的纵向神经影像数据集。
  • 许可证:Creative Commons CC0 1.0 Universal(CC0 1.0),可自由复制、修改、分发和使用,包括商业用途。
  • 数据集大小:下载大小约 5.72 GB,数据集总大小约 6.30 GB。
  • 划分:仅包含训练集(train),共 210,856 个样本。

数据集结构

每个条目对应一个3D MRI体积中的单个2D切片,包含以下字段:

  • volume_id(int32):受试者/体积的唯一标识符
  • wave_id(int32):纵向采集轮次(1、2或3)
  • type(string):图像类型,取值为 t1w(T1加权)或 t2w(T2加权)
  • slice_id(int32):切片在体积中的索引
  • image(image):2D MRI切片图像

数据来源与背景

  • 研究对象:年龄在21至89岁之间的认知正常参与者,首次评估后约每3.5–5年返回,最多进行三轮数据采集。
  • 原始数据:包含T1加权、T2加权、功能MRI、动脉自旋标记(ASL)和弥散张量成像(DTI)图像。
  • 本数据集提供:从认知正常受试者所有可用轮次中提取的基于2D切片的T1加权和T2加权MRI体积

预处理

  • 仅使用T1加权(T1w)和T2加权(T2w)体积
  • 体积转换为2D轴向切片
  • 切片经过归一化处理并调整大小为256×256

使用示例

python from datasets import load_dataset import matplotlib.pyplot as plt

ds = load_dataset("chehablab/DLBS", split="train")

sample = ds[314] img = sample["image"]

plt.imshow(img, cmap="gray") plt.title(f"Volume {sample[volume_id]} | Wave {sample[wave_id]} | Slice {sample[slice_id]} | Type {sample[type]}") plt.axis("off") plt.show()

引用

如使用本数据集,请致谢 Chehab Lab(官网:https://chehablab.com/)并引用原始DLBS数据集:

bibtex @article{Park2025, author = {Park, Denise C. and Wig, Gagan S. and others}, title = {The Dallas Lifespan Brain Study: A Comprehensive Adult Lifespan Data Set of Brain and Cognitive Aging}, journal = {Scientific Data}, year = {2025}, doi = {10.1038/s41597-025-04847-7}, }

搜集汇总
数据集介绍
main_image_url
构建方式
DLBS数据集源自达拉斯寿命大脑研究(Dallas Lifespan Brain Study),这是一项涵盖成人全生命周期的纵向神经影像学研究,参与者年龄跨度为21至89岁,每3.5至5年进行一次数据采集,最多可完成三轮追踪。该数据集聚焦于认知正常个体的T1加权和T2加权MRI影像,将原始三维体数据转化为二维轴向切片形式。每张切片均经过归一化处理并统一缩放至256×256像素,以确保空间分辨率的一致性。每个数据条目包含唯一的volume_id标识受试者与体数据,wave_id标明纵向采集的波次号,type区分T1w或T2w序列,slice_id记录切片在体数据中的索引位置,image字段则存储处理后的二维MRI图像。
特点
该数据集的核心特点在于其纵向追踪设计与切片化结构。通过三轮跨时间的重复测量,研究者能够追踪个体脑结构在成年期内的动态变化轨迹,为探究脑与认知衰老的演化规律提供了宝贵素材。将三维MRI体数据拆解为二维轴向切片,显著降低了数据处理的复杂度,使其便于直接接入常见的二维卷积神经网络等深度学习模型。同时,数据集仅纳入认知正常受试者,排除了病理因素的干扰,从而更好地反映正常老化过程中的脑结构特征。每个切片均保留了原始序列类型标记,支持T1w与T2w图像的独立或联合分析。
使用方法
研究人员可通过Hugging Face的datasets库便捷加载该数据集。使用load_dataset函数指定数据集名称'chehablab/DLBS',即可获取训练集分割中的全部切片样本。每个样本以字典形式包含volume_id、wave_id、type、slice_id及image字段,其中image为可直接用于可视化与模型输入的PIL图像对象。典型使用流程包括:加载数据集后按需筛选特定波次或序列类型的切片;利用matplotlib等可视化工具展示图像并叠加元数据标签,以验证数据质量;将图像数组转换为张量后输入神经网络进行训练或推理。数据集采用CC0 1.0公共领域许可,可自由用于学术与商业用途。
背景与挑战
背景概述
DLBS(Dallas Lifespan Brain Study)数据集源自一项覆盖成人全生命周期的纵向神经影像研究,由Park、Wig等学者主导,于2025年公开发布于Scientific Data。该研究旨在系统刻画成年期(21至89岁)大脑结构与认知功能随年龄演化的轨迹,核心问题聚焦于跨年龄段的脑老化异质性及认知衰退的神经基础。数据集整合了T1加权与T2加权MRI体积的二维切片影像,来自认知正常被试的多次纵向采集波次,为神经科学领域提供了标准化、高质量的年龄相关脑影像样本,其开放获取特性显著推动了脑老化研究的可重复性与多机构协作。
当前挑战
该数据集所应对的领域核心挑战在于脑年龄研究的纵向数据稀缺性及影像异质性——传统横截面研究难以分离个体内老化效应与群体差异,而多中心采集带来的扫描参数差异又阻碍了跨研究融合。构建过程中,团队需处理纵向数据中高阶的随访丢失与采集波次不均,并对原始三维MRI体积进行精准切片化转换与标准化预处理,包括通过归一化与重采样至统一256×256尺寸以消除空间分辨率差异,同时保留临床相关的解剖细节,确保每个二维切片的生物学可解释性与下游分析的可靠性。
常用场景
经典使用场景
DLBS数据集作为一项横跨成年全生命周期的纵向神经影像资源,其经典使用场景聚焦于利用T1加权和T2加权MRI切片的二维图像进行脑结构与认知老化关联的深度学习建模。研究人员可基于海量标准化2D切片(分辨率为256×256),训练卷积神经网络以预测受试者的生理年龄、识别与年龄相关的脑区萎缩模式,或构建跨波次(wave1至wave3)的纵向变化追踪模型,从而揭示大脑形态随时间推移的退化轨迹。该数据集以切片级细粒度呈现,特别适合在数据量受限时通过迁移学习或对比学习,从局部解剖特征挖掘全局衰老信号,为跨学科研究神经退行性疾病的早期影像标志物提供了高效且可复现的基准平台。
衍生相关工作
DLBS数据集衍生了多个具有广泛学术影响力的经典工作,其中最核心的是推动了基于切片级特征的大脑年龄预测基准模型的建立。研究者借助该数据集训练了多种架构的深度网络(如ResNet、Vision Transformer),系统比较了不同注意力机制在提取T1w/T2w模态特异性老化模式上的优势,进而开发出轻量级诊断工具。此外,该数据集还催生了跨数据集泛化性研究,即通过将DLBS切片上学习的萎缩规律迁移至ADNI、UK Biobank等独立队列,验证了纵向切片表示在跨种群老化评估中的鲁棒性,提出了神经影像的“元学习”(meta-learning)框架。更进一步,结合生成对抗网络(GAN),衍生的相关工作可进行缺失波次图像的合成,模拟受试者未采集年份的脑状态,为填补纵向研究中的脱落数据提供了创新性解决方案。
数据集最近研究
最新研究方向
当前,基于DLBS数据集的2D切片版本正成为探索人脑衰老轨迹与认知退行性病变交叉领域的前沿研究利器。研究热点聚焦于利用大规模纵向T1/T2加权MRI影像,结合深度学习模型(如卷积神经网络与Transformer),开展全生命周期脑结构变化的时空建模与异常模式识别。该数据集通过提供标准化、高分辨率的2D脑部切片,显著降低了计算资源门槛,使得多中心、跨波次的脑龄预测、阿尔茨海默病早期生物标志物挖掘及认知健康与结构萎缩的关联分析成为可能。其CC0许可的开放共享模式,更将有力推动生命科学领域可重复性研究与全球协作,为理解正常与病理性脑老化机制注入新动力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作