five

things-eeg

收藏
Hugging Face2025-11-14 更新2025-11-15 收录
下载链接:
https://huggingface.co/datasets/perottofederico/things-eeg
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含EEG信号、标签、文本描述、受试者ID、图像ID、图像数据、时间序列和通道名称的数据集。数据集分为测试集和训练集,测试集包含2000个示例,训练集包含198480个示例,可用于EEG信号分析相关的研究和任务。

This is a dataset containing EEG signals, labels, text descriptions, subject IDs, image IDs, image data, time series, and channel names. The dataset is divided into a training set and a test set: the test set includes 2000 samples, while the training set consists of 198,480 samples. It can be used for research and tasks related to EEG signal analysis.
创建时间:
2025-11-14
原始信息汇总

数据集概述

基本信息

  • 数据集名称: perottofederico/things-eeg
  • 下载大小: 15,973,147,866字节
  • 数据集大小: 21,211,614,786.52字节

数据结构

特征字段

  • eeg: 二维数组,形状为[63, 250],数据类型为float32
  • label: 整型标签,数据类型为int64
  • text: 文本数据,数据类型为string
  • subject: 被试者标识,数据类型为string
  • img_id: 图像标识,数据类型为string
  • image: 图像数据,数据类型为image
  • times: 时间序列,数据类型为float32序列
  • ch_names: 通道名称序列,数据类型为string序列

数据划分

训练集

  • 样本数量: 198,480
  • 数据大小: 21,001,317,446.52字节

测试集

  • 样本数量: 2,000
  • 数据大小: 210,297,340字节

配置信息

  • 配置名称: default
  • 训练集文件路径: data/train-*
  • 测试集文件路径: data/test-*
搜集汇总
数据集介绍
main_image_url
构建方式
在认知神经科学领域,things-eeg数据集通过精心设计的实验范式构建而成,涵盖了198,480个训练样本和2,000个测试样本。该数据集整合了脑电图信号、视觉刺激图像及对应文本描述,采用63个电极通道以250Hz采样率记录神经活动数据。构建过程严格遵循实验伦理规范,确保数据采集的一致性与可重复性,为研究感知认知机制提供了可靠的多模态基准。
特点
该数据集最显著的特点是实现了神经活动与多模态刺激的精确对齐,每个样本包含63×250维度的脑电信号阵列及其对应的图像刺激、文本标签。数据覆盖多个被试群体,通过标准化的电极命名和时序标记保障了时空分辨率。这种多维度的数据结构为探索视觉感知、概念表征等认知过程提供了丰富的分析维度,其规模与质量在同类数据集中具有突出优势。
使用方法
研究者可通过加载标准化的数据分割直接开展机器学习建模,训练集适用于构建脑电信号分类或跨模态检索模型,测试集则用于评估模型泛化能力。典型应用包括利用卷积神经网络处理脑电时空特征,或结合图像-文本模态开展多任务学习。数据集的规范格式支持与主流深度学习框架无缝对接,为认知计算研究提供了便捷的实验基础。
背景与挑战
背景概述
认知神经科学领域长期致力于探索人类大脑如何处理视觉信息,things-eeg数据集应运而生,由国际跨学科研究团队于2020年代初期构建。该数据集通过同步记录受试者观看物体图像时的脑电图信号与视觉刺激,旨在揭示大脑表征与物体识别机制之间的映射关系。其创新性在于融合多模态数据,包括高时间分辨率的EEG信号、语义标签和对应图像,为神经解码与脑机接口研究提供了关键实验基础,显著推动了视觉认知计算模型的发展。
当前挑战
视觉物体识别研究面临大脑活动解码的复杂性挑战,需从非平稳的EEG信号中提取稳定特征以区分细粒度物体类别。数据集构建过程中存在多重技术难点:同步采集EEG与视觉刺激时需严格控制实验环境以避免运动伪影;63通道高密度电极的数据预处理涉及复杂的去噪与时空对齐;跨被试神经响应差异要求标准化流程确保数据可比性。这些挑战共同凸显了神经数据标准化与跨模态融合的技术壁垒。
常用场景
经典使用场景
在认知神经科学领域,things-eeg数据集通过同步记录脑电图信号与视觉刺激响应,为研究物体识别与语义处理的神经机制提供了关键数据支撑。该数据集整合了高密度脑电记录与标准化图像刺激,使研究人员能够深入分析大脑在感知不同物体类别时的时空动态特征,从而揭示认知过程中的神经编码规律。
实际应用
在现实应用中,things-eeg数据集为脑机接口技术的发展提供了重要训练数据,特别是在基于脑电信号的物体识别系统设计中。该数据集支持的算法开发已应用于神经康复工程领域,帮助构建能够解读用户视觉意图的智能系统,为运动功能障碍患者创造新型交互通道。
衍生相关工作
基于things-eeg数据集衍生的经典研究包括深度神经网络与脑电信号融合的跨模态分析框架,这些工作推动了神经解码算法的重大突破。相关成果已延伸至脑启发式计算模型构建,促进了计算机视觉与认知神经科学的交叉融合,为类脑智能系统的开发奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作