neurodatasets

github2026-02-26 更新2026-03-03 收录

下载链接：

https://github.com/lightbluetitan/neurodatasets-py

下载链接

链接失效反馈

官方服务：

资源简介：

neurodatasets包提供了一个精心策划的神经科学和脑相关数据集的集合，用于数据分析、统计建模和机器学习研究。包括生物医学语音记录、MRI脑成像、阿尔茨海默病和帕金森病生物标志物、癫痫发作、ADHD症状、多巴胺和血清素测量、认知障碍、跨物种脑大小、睡眠研究、PTSD、偏头痛治疗等来自CRAN上策划的R包的数据集。

The neurodatasets package provides a curated collection of neuroscience and brain-related datasets for data analysis, statistical modeling, and machine learning research. These datasets are sourced from curated R packages on CRAN, covering biomedical speech recordings, MRI brain imaging, biomarkers for Alzheimer's disease and Parkinson's disease, seizure episodes, ADHD symptoms, dopamine and serotonin measurements, cognitive impairment, cross-species brain size, sleep studies, PTSD, migraine treatment, and more.

创建时间：

2026-02-21

原始信息汇总

neurodatasets 数据集概述

数据集来源与性质

该数据集集合源自 neurodatasets Python 包，该包提供了一个精选的神经科学和大脑相关数据集的集合。
所有数据集均源自 CRAN 上精选的 R 包，并保留了其原始许可证和归属信息。
该集合严格用于教育、研究和信息目的。

数据集内容与主题

数据集涵盖神经科学和大脑相关领域，包括但不限于：
- 生物医学语音记录
- MRI 脑成像
- 阿尔茨海默病和帕金森病生物标志物
- 癫痫发作
- 多动症症状
- 多巴胺和血清素测量
- 认知障碍
- 跨物种大脑尺寸
- 睡眠研究
- 创伤后应激障碍
- 偏头痛治疗

部分可用数据集示例

数据集名称	描述
`gray_matter_patterns`	包含来自 ENIGMA 联盟大规模荟萃分析得出的灰质预期模式。
`white_matter_patterns`	包含来自 ENIGMA 联盟大规模荟萃分析得出的白质预期模式。
`encephalitis_herpes`	包含 1980 年至 1993 年间在巴伐利亚和下萨克森州观察到的儿童疱疹性脑炎病例。
`sleep_study_college`	包含大学生睡眠模式和学习成绩的数据。
`alzheimer_smoking`	包含一项关于阿尔茨海默病的病例对照研究中的吸烟史和疾病分类数据。
`brain_size_iq`	包含心理学学生用于智力研究的大脑尺寸、智商分数和性别数据。
`mammal_brains`	包含 96 种哺乳动物的脑重量、体重、妊娠期和每窝产仔数数据。
`chimp_brains`	包含按性别划分的黑猩猩布罗德曼 44 区不对称性测量数据。

访问与使用

可通过 PyPI 安装 neurodatasets 包进行访问：pip install neurodatasets。
支持 Python 3.8 及以上版本。
主要功能函数包括：
- list_datasets()：列出所有可用数据集。
- load_dataset(dataset_name)：加载特定数据集。
- describe(dataset_name)：描述数据集。

许可证与免责声明

neurodatasets 库在 GPL-3.0 许可证下发布。
作者不对任何数据集的准确性、完整性或适用于特定目的的适用性作任何明示或暗示的保证。
用户对确保其使用这些数据集符合适用的法律、法规和道德准则负全部责任。
严禁将数据集用于临床、诊断或医疗决策目的。

搜集汇总

数据集介绍

构建方式

在神经科学数据整合领域，neurodatasets数据集通过精心筛选与系统化整理，构建了一个跨学科的数据资源库。该数据集主要汇集了来自CRAN平台上经过同行评审的R包中的公开数据，涵盖了从脑成像、神经退行性疾病生物标志物到认知行为研究等多个子领域。其构建过程注重数据的可追溯性与标准化，确保每个数据集均保留了原始的元数据与授权信息，从而为研究者提供了一个既全面又可靠的数据访问接口。

特点

neurodatasets数据集展现出高度的多样性与专业性，囊括了如ENIGMA联盟的大规模灰质与白质模式分析、儿童疱疹性脑炎病例记录、哺乳动物脑体重量比较以及睡眠与学业表现关联研究等一系列主题。这些数据不仅覆盖了人类与跨物种的神经生物学特征，还包含了临床与认知心理学的重要指标，为跨模态分析提供了丰富素材。数据集经过统一格式化处理，支持通过Python接口直接加载，极大简化了数据获取与预处理流程，促进了神经科学计算研究的可重复性。

使用方法

使用neurodatasets数据集时，研究者可通过简单的Python命令安装并导入相应库，快速浏览所有可用数据集的列表。利用load_dataset函数可直接加载特定数据集至Pandas DataFrame中，便于进行后续的统计分析或机器学习建模。数据集描述功能则提供了关键元信息摘要，辅助用户理解数据结构与背景。该工具设计注重用户体验，使得即使非专业编程人员也能高效访问复杂的神经科学数据，为教育、研究与临床探索提供了便捷的入口。

背景与挑战

背景概述

神经科学作为探索大脑结构与功能的前沿领域，长期面临着数据分散与标准化不足的挑战。neurodatasets数据集应运而生，作为一个精心策划的Python软件包，它整合了来自CRAN上多个R包的神经科学相关数据集，涵盖了从脑成像、神经退行性疾病到认知行为研究的广泛主题。该数据集的创建旨在为研究人员提供一个统一、便捷的接口，以促进跨学科的数据分析、统计建模和机器学习应用，从而加速神经科学领域的发现与创新。

当前挑战

neurodatasets数据集所解决的领域问题在于神经科学数据的集成与可访问性，其核心挑战包括处理多源异构数据的标准化与一致性，确保来自不同研究协议和采集方法的数据能够有效整合。在构建过程中，数据集面临数据格式转换、元数据标注以及伦理合规性审查等难题，同时需维护原始数据的许可与归属，以支持可重复研究并符合科学伦理规范。

常用场景

经典使用场景

在神经科学领域，neurodatasets数据集常被用于跨物种脑结构与功能比较研究。例如，通过整合哺乳动物脑重量、体重量及认知数据，研究者能够深入探究脑进化与认知能力之间的关联机制，为理解智能演化提供量化依据。

实际应用

在临床医学与公共卫生领域，neurodatasets支持睡眠障碍与学业表现的关联分析，为高校学生健康管理提供数据支撑。同时，其收录的疱疹性脑炎病例数据可用于流行病学建模，辅助公共卫生部门制定针对性的神经系统感染疾病防控策略。

衍生相关工作

基于该数据集衍生的经典研究包括ENIGMA联盟的脑结构meta分析框架，该框架利用标准化灰质与白质模式推动了全球脑影像数据的协同研究。此外，数据集启发了跨物种脑进化计算模型的开发，为比较神经学提供了开源算法基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集