five

ICLabel Dataset

收藏
github2024-03-15 更新2024-05-31 收录
下载链接:
https://github.com/lucapton/ICLabel-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ICLabel数据集旨在推进自动化脑电图(EEG)独立成分(IC)分类。该数据集包含一个未标记的训练数据集、几个针对训练数据集小部分的标签集合以及一个包含130个IC的测试数据集,每个IC由6位专家标记。数据集总计包含来自数十万个独特EEG IC的特征(如果计算来自同一数据集不同处理阶段的相似IC,则达数百万个)。大约8000个IC有标签,实际可用数量通常接近6000,具体取决于使用的特征。提供的特征包括:头皮地形图图像、功率谱密度、自相关函数、等效电流偶极子拟合和手工制作的特征。原始时间序列数据不可用,仅提供本仓库中包含的内容。

The ICLabel dataset is designed to advance the automated classification of independent components (ICs) in electroencephalography (EEG). This dataset includes an unlabeled training dataset, several label sets for small portions of the training dataset, and a test dataset containing 130 ICs, each labeled by six experts. In total, the dataset encompasses features from hundreds of thousands of unique EEG ICs (reaching millions if similar ICs from different processing stages of the same dataset are counted). Approximately 8,000 ICs are labeled, with the actual usable number typically close to 6,000, depending on the features used. The provided features include: scalp topography images, power spectral density, autocorrelation functions, equivalent current dipole fitting, and handcrafted features. The original time series data is not available; only the contents included in this repository are provided.
创建时间:
2019-01-04
原始信息汇总

ICLabel Dataset 概述

数据集内容

  • 类型: 包含未标记的训练数据集、多个针对训练数据集小部分的标签集合以及一个包含130个独立成分(ICs)的测试数据集。
  • 数据量: 包含来自数十万独特EEG独立成分的特征(若计入来自同一数据集不同处理阶段的相似ICs,则数量可达数百万)。
  • 标记数据量: 约8000个ICs有标签,实际可用数量通常接近6000,具体取决于使用的特征。
  • 特征:
    • 头皮地形图图像(32x32像素,去除空白后扁平化为740元素)
    • 功率谱密度(1-100 Hz)
    • 自相关函数(1秒)
    • 等效电流偶极子拟合(1和2偶极子)
    • 手工制作的特征(包括新特征和来自先前发布分类器的特征)

数据集限制

  • 原始时间序列数据不可用。

数据集使用

  • 使用步骤:

    1. 加载类,传递任何所需选项。
    2. 加载数据集。
  • 示例代码:

    icl = ICLabelDataset() icl.download_trainset_features() icldata = icl.load_semi_supervised()

搜集汇总
数据集介绍
main_image_url
构建方式
ICLabel数据集的构建旨在推动脑电图(EEG)独立成分(IC)自动分类技术的发展。该数据集通过众包方式在ICLabel网站上收集标签,这些标签随后用于训练ICLabel分类器。数据集包含未标记的训练数据、多个小规模子集的标签集合,以及一个由六位专家标记的130个IC的测试数据集。数据集的特征包括头皮地形图、功率谱密度、自相关函数、等效电流偶极子拟合以及手工制作的特征。
特点
ICLabel数据集的特点在于其丰富的特征集合和多样化的标签来源。数据集涵盖了数十万个独特的EEG IC特征,其中约8000个IC具有标签,实际可用数量通常接近6000。特征包括32x32像素的头皮地形图、1-100 Hz的功率谱密度、1秒的自相关函数、1和2偶极子的等效电流偶极子拟合,以及手工制作的特征。这些特征为研究者提供了全面的分析工具,有助于深入理解EEG IC的分类问题。
使用方法
使用ICLabel数据集时,首先需要加载相应的类并传递所需的选项。随后,可以下载训练集的特征并加载半监督数据集。例如,通过调用`ICLabelDataset()`类,用户可以下载训练集特征并加载半监督数据。这种方法使得研究者能够灵活地利用数据集进行模型训练和验证,从而推动EEG IC分类技术的研究与应用。
背景与挑战
背景概述
ICLabel数据集是专为推进脑电图(EEG)独立成分(IC)自动分类而设计的项目,由ICLabel分类器、ICLabel网站及数据集三部分构成。该项目通过众包方式收集数据标签,进而训练分类器,旨在提升EEG信号处理的自动化水平。数据集包含未标记的训练数据、部分标记数据子集及由六位专家标记的130个独立成分的测试集,涵盖了数十万独特EEG独立成分的特征。尽管原始时间序列数据不可用,但数据集提供了头皮地形图、功率谱密度、自相关函数等多种特征,为EEG信号分析提供了丰富资源。
当前挑战
ICLabel数据集在构建与应用过程中面临多重挑战。在领域问题层面,EEG独立成分的自动分类需处理信号的高维性与复杂性,如何准确区分不同成分并减少误分类是关键难题。在数据集构建过程中,原始时间序列数据的缺失限制了数据的多用途性,尽管提供了多种特征,但无法完全替代原始信号。此外,众包标签的质量与一致性也是重要挑战,需通过专家验证确保标签的可靠性。这些挑战共同影响了数据集在EEG信号处理领域的广泛应用与深入分析。
常用场景
经典使用场景
ICLabel数据集在脑电图(EEG)独立成分(IC)分类领域具有重要应用。通过提供大量的未标记和标记数据,该数据集为研究人员提供了一个标准化的平台,用于开发和验证自动化IC分类算法。其经典使用场景包括训练和测试机器学习模型,特别是深度学习模型,以识别和分类EEG信号中的独立成分。
实际应用
在实际应用中,ICLabel数据集被广泛用于开发脑电图信号处理工具和系统。例如,在临床诊断中,自动化IC分类系统可以帮助医生快速识别异常脑电活动,提高诊断效率。此外,该数据集还被用于开发脑机接口技术,通过精确分类脑电信号,提升设备的响应速度和准确性。
衍生相关工作
ICLabel数据集催生了一系列相关研究工作,特别是在脑电图信号处理和机器学习领域。基于该数据集,研究人员开发了多种先进的IC分类算法,如基于深度学习的卷积神经网络(CNN)和递归神经网络(RNN)。这些算法不仅在学术界得到了广泛认可,还在实际应用中展现了显著的效果,进一步推动了脑电图信号处理技术的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作