WU-Minn HCP1200 Data|脑部成像数据集|神经科学研究数据集
收藏数据集概述
数据集来源
- 名称: Human Connectome Project Open Access dataset
- 来源: HCP (Human Connectome Project)
- 目标: 构建个体间完整结构和功能神经连接的活体地图
数据内容
- 样本: 年轻健康成年双胞胎及非双胞胎兄弟姐妹(年龄22-35岁)
- 数据类型:
- 结构图像(T1w和T2w)
- 静息态功能磁共振成像(rfMRI)
- 任务态功能磁共振成像(tfMRI)
- 高角度分辨率扩散成像(dMRI)
- 行为和其他个体测量数据
- MEG数据和7T MR数据(部分样本)
数据访问与检索
- 工具: DataLad (版本0.12.2或更高)
- 访问条件: 需同意WU-Minn HCP Consortium Open Access Data Use Terms并获取有效的AWS凭证
- 获取步骤:
- 在db.humanconnectome.org创建账户
- 登录并接受数据使用条款
- 启用Amazon S3访问以获取访问密钥ID和秘密访问密钥
数据集结构
- 组织方式: 每个
HCP1200/
主题目录为一个DataLad子数据集 - 访问方法: 使用
datalad get -n <subject-id>
命令克隆子数据集并访问发布说明
使用DataLad
- 功能: 允许细粒度数据访问,无需托管HCP数据
- 安装指南: 参考handbook.datalad.org/en/latest/intro/installation.html
- 基本操作:
- 克隆数据集:
datalad clone <url>
- 检索数据内容:
datalad get <path/to/directory/or/file>
- 更新数据集:
datalad update --merge
- 克隆数据集:
数据集使用说明
获取数据集
- 命令:
datalad clone <url>
检索数据内容
- 命令:
datalad get <path/to/directory/or/file>
更新数据集
- 命令:
datalad update --merge
更多信息
- 资源: DataLad Handbook (handbook.datalad.org)

中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录