TUH-EEG-Dataset|脑电图数据集|机器学习数据集
收藏TUH-EEG-Dataset 概述
数据集目的
本项目旨在将 Temple University Hospital 提供的 30,000 份 EEG 患者文件整理成一个便于提取干净时段以训练机器学习模型,并能全局了解各个数据集之间联系的数据库。
数据集结构
数据集采用两级层次结构设计,顶层 CSV 文件汇总了其他数据集的元数据。每行数据由患者 ID 和会话号组合唯一确定,结合特定的标签/人工制品,可从下级 CSV 文件中获取具体信息。
文件概览
- Extract.py: 从 TUSZ 数据集中提取和解析数据的示例代码。
- Label.py: 从 TUH 数据集中的 .lbl 和 .tse 文件提取数据的代码。
- Queries.py: 数据库查询代码。
- database folder: 包含两级 CSV 设计,具体包括:
- 顶层实体
- TUAB 数据集
- TUAR 数据集
- TUEP 数据集

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
