Healthy Brain Network临床EEG数据集
收藏arXiv2022-04-14 更新2024-06-21 收录
下载链接:
https://childmind.s3.us-west1.amazonaws.com/python/childmind_python.zip
下载链接
链接失效反馈官方服务:
资源简介:
Healthy Brain Network临床EEG数据集是由加州大学圣地亚哥分校计算神经科学中心创建,包含1,574名青少年参与者的闭眼EEG数据。数据集大小为每位参与者约81个2秒的样本,总计约127,000个样本。创建过程中,数据经过最小预处理,包括去均值、降采样和滤波等步骤。该数据集主要用于深度学习研究,特别是神经科学领域,旨在通过深度学习技术提高对脑电信号的理解和分析能力,以推动神经科学和神经技术的发展。
The Healthy Brain Network Clinical EEG Dataset was developed by the Center for Computational Neuroscience at the University of California, San Diego. It contains eyes-closed electroencephalogram (EEG) data from 1,574 adolescent participants. Each participant contributes approximately 81 2-second EEG segments, yielding a total of roughly 127,000 samples across the full dataset. During the dataset creation process, the raw EEG data underwent minimal preprocessing steps including mean subtraction, downsampling, and filtering. This dataset is primarily designed for deep learning research in the neuroscience domain, with the objective of enhancing the understanding and analytical capabilities of electroencephalographic signals through deep learning technologies, thereby advancing the development of both neuroscience and neurotechnology.
提供机构:
加州大学圣地亚哥分校计算神经科学中心
创建时间:
2022-03-05
搜集汇总
数据集介绍
构建方式
Healthy Brain Network临床EEG数据集是由Child Mind Institute发起的健康大脑网络项目的一部分,旨在创建和共享一个包含多达一万名儿童和青少年的社区数据生物银行。本数据集从该项目中选取了1574名参与者在静息状态下的EEG数据,通过EEGLAB进行最小化预处理,包括去除眼动伪迹、重参考、滤波和分段,最终形成了适用于深度学习的格式。数据集按照60:30:10的比例划分为训练集、验证集和测试集,每个样本包含24个通道和2秒×128Hz的时间点数据。
特点
该数据集的特点在于其大规模性、标准化处理和深度学习友好性。它不仅规模宏大,包含丰富的元数据,而且提供了多种标签,包括性别、年龄和利手信息,以及临床信息的匹配可能性。数据集支持在线流式传输,减轻了用户在本地存储和管理数据的需求,同时提供了适用于MATLAB和Python的深度学习框架。
使用方法
用户可以通过MATLAB或Python的深度学习框架来使用这个数据集。数据集支持直接从AWS S3存储桶进行流式传输,用户无需下载整个数据集即可进行模型训练。通过提供的示例脚本和GitHub仓库中的综合示例,用户可以轻松地加载和利用数据集进行深度学习研究。此外,该数据集还配备了公共计算资源,以便研究人员进行高性能计算。
背景与挑战
背景概述
Healthy Brain Network临床EEG数据集,是由Child Mind Institute发起的一项持续的数据共享项目,旨在创建和共享一个包含多达一万名儿童和青少年的社区数据生物库。该数据集的创建时间为2017年,主要研究人员包括Dung Truong、Manisha Sinha、Kannan Umadevi Venkataraju和Michael Milham等。该数据集的核心研究问题是推动深度学习在EEG数据分析中的应用,并提供了首个大规模、为深度学习优化的EEG数据集。该数据集的发布对于推动神经科学领域的研究具有重要意义,特别是在电生理神经成像领域。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:如何将大规模EEG数据格式化为适合深度学习应用的形式,以及如何在保证数据隐私和安全的前提下,实现数据的便捷访问和高效管理。具体挑战包括:1) EEG数据的预处理和格式化,以便能够被深度学习模型直接使用,而无需进行复杂的特征工程;2) 在保护参与者隐私的同时,提供一种高效的数据访问机制,使得研究人员能够方便地获取和使用数据。
常用场景
经典使用场景
Healthy Brain Network临床EEG数据集,作为深度学习领域内首个大规模EEG数据集,其经典使用场景在于为深度学习模型提供丰富的训练数据,特别是在电生理神经影像学领域。该数据集包含闭眼状态下的EEG数据,通过高性能计算平台进行预处理和格式化,使得研究人员能够直接应用于深度学习模型,如生物性别分类任务,从而揭示了深度学习在脑电图信号处理中的潜力。
解决学术问题
该数据集解决了传统EEG分析中需要大量专业知识进行预处理的问题,使得非EEG领域的专家也能够轻松地使用这些数据进行深度学习研究。此外,数据集的元数据丰富,包括性别、年龄和手性等,为跨学科研究提供了便利,极大地推动了神经科学和生物医学研究的进展。
衍生相关工作
基于该数据集,已衍生出一系列相关工作,如利用深度学习进行脑电图信号的自监督学习,以及将EEG数据转换为适合深度学习的格式。这些工作进一步拓展了EEG数据集的应用范围,为未来的科学研究和技术创新奠定了基础。
以上内容由遇见数据集搜集并总结生成



