SADT 和 SEED-VIG|驾驶员疲劳监测数据集|生物信号处理数据集

github2024-06-27 更新2024-07-18 收录

驾驶员疲劳监测

生物信号处理

下载链接：

https://github.com/cuijiancorbin/Benchmarking-EEG-based-cross-dataset-driver-drowsiness-recognition-with-deep-transfer-learning

下载链接

链接失效反馈

资源简介：

SADT 数据集是一个用于驾驶员疲劳监测的 EEG 数据集，而 SEED-VIG 数据集是一个用于跨数据集驾驶员疲劳识别的提取数据集。

创建时间：

2024-06-26

原始信息汇总

基于深度迁移学习的跨数据集驾驶员疲劳识别基准

数据集概述

该数据集用于基于脑电图（EEG）的跨数据集驾驶员疲劳识别。数据集包括两个处理后的数据集：

SADT数据集：可从此处下载。
SEED-VIG数据集：可从此处下载。

模型性能

提出的Entropy-Driven Joint Adaptation Network (EDJAN)模型在跨数据集识别中取得了以下性能：

从SADT迁移到SEED-VIG时，平均准确率为83.68%。
从SEED-VIG迁移到SADT时，准确率为76.90%。

所需库

torch
scipy
numpy
sklearn

联系信息

如有问题，请联系Dr. Cui Jian at cuijian@zhejianglab.com。

AI搜集汇总

数据集介绍

构建方式

在构建SADT和SEED-VIG数据集时，研究团队采用了跨数据集的策略，旨在通过深度迁移学习模型解决不同实验环境下的分布漂移问题。具体而言，数据集的构建涉及从源域和目标域同时学习有用信息，利用熵驱动的损失函数促进目标域表示的聚类，并采用个体级别的域适应技术来缓解测试对象的分布差异问题。

特点

SADT和SEED-VIG数据集的主要特点在于其跨数据集的特性，这使得它们在驾驶员疲劳监测领域具有显著的应用价值。通过深度迁移学习模型，这些数据集能够在不同实验环境下保持较高的识别准确率，从而有效节省校准时间。此外，数据集的构建还特别关注了个体级别的域适应，以确保在不同测试对象间的分布一致性。

使用方法

使用SADT和SEED-VIG数据集时，首先需下载处理后的数据集文件，并确保安装了所需的库，如torch、scipy、numpy和sklearn。随后，可以利用提供的深度迁移学习模型代码，特别是Entropy-Driven Joint Adaptation Network (EDJAN)，进行跨数据集的驾驶员疲劳识别。通过调整模型参数和训练策略，用户可以进一步优化识别效果，并在实际应用中验证其性能。

背景与挑战

背景概述

在利用脑电图（EEG）进行驾驶员疲劳监测的研究中，数据校准通常需要耗费大量时间。为了解决这一问题，跨数据集识别成为一种理想的选择，因为它可以显著减少使用现有数据集时的校准时间。然而，不同实验环境导致的分布漂移问题影响了跨数据集识别的准确性。为此，Cui Jian等人提出了一种名为熵驱动联合适应网络（EDJAN）的深度迁移学习模型，该模型能够同时从源域和目标域中学习有用信息，并通过熵驱动损失函数促进目标域表示的聚类，以及提出个体级别的域适应技术来缓解测试对象的分布差异问题。该研究在2023年IEEE工程医学与生物学学会（EMBC）年会上发表，展示了其在SADT和SEED-VIG数据集上的显著成果。

当前挑战

尽管EDJAN模型在跨数据集驾驶员疲劳识别中取得了显著的准确性，但仍面临若干挑战。首先，不同实验环境导致的分布漂移问题仍然是一个主要障碍，影响了模型的泛化能力。其次，数据集的构建过程中，如何确保数据的质量和一致性也是一个重要挑战。此外，尽管EDJAN模型在特定数据集间的迁移表现良好，但其跨多个数据集的稳定性和鲁棒性仍需进一步验证。最后，模型的解释性问题也亟待解决，以便更好地理解和应用该技术于实际驾驶环境中。

常用场景

经典使用场景

在基于脑电图（EEG）的驾驶员疲劳监测领域，SADT和SEED-VIG数据集的经典使用场景主要集中在跨数据集的驾驶员疲劳识别。通过深度迁移学习模型，如Entropy-Driven Joint Adaptation Network (EDJAN)，研究人员能够有效利用源域和目标域的数据，实现跨数据集的疲劳状态识别。这种跨数据集的识别方法不仅显著减少了数据校准时间，还提高了识别精度，解决了不同实验环境下数据分布漂移的问题。

实际应用

在实际应用中，SADT和SEED-VIG数据集为驾驶员疲劳监测系统的设计和优化提供了宝贵的数据支持。通过这些数据集，工程师和研究人员能够开发出更为精准和鲁棒的疲劳检测算法，从而提高驾驶安全性和舒适性。此外，这些数据集的应用还推动了相关技术的产业化进程，为智能交通系统和自动驾驶技术的发展奠定了坚实的基础。

衍生相关工作

基于SADT和SEED-VIG数据集，衍生了一系列重要的相关工作。例如，Cui等人提出的Interpretable Convolutional Neural Network (ICNN)模型，进一步优化了EEG数据的处理和分析方法，提升了驾驶员疲劳识别的准确性和可解释性。此外，这些数据集还激发了更多关于深度迁移学习和域适应技术的研究，推动了该领域的技术进步和创新。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4099个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国1km分辨率逐月降水量数据集（1901-2023）

该数据集为中国逐月降水量数据，空间分辨率为0.0083333°（约1km），时间为1901.1-2023.12。数据格式为NETCDF，即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集，通过Delta空间降尺度方案在中国降尺度生成的。并且，使用496个独立气象观测点数据进行验证，验证结果可信。本数据集包含的地理空间范围是全国主要陆地（包含港澳台地区），不含南海岛礁等区域。为了便于存储，数据均为int16型存于nc文件中，降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理，Matlab发布了读入与存储nc文件的函数，读取函数为ncread，切换到nc文件存储文件夹，语句表达为：ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent])，其中XXX.nc为文件名，为字符串需要’’；var是从XXX.nc中读取的变量名，为字符串需要’’；i、j、t分别为读取数据的起始行、列、时间，leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样，研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令，可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心收录

猫狗图像数据集

该数据集包含猫和狗的图像，每类各12500张。训练集和测试集分别包含10000张和2500张图像，用于模型的训练和评估。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集，该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术（如分类、编码和二值化）来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准，由华东师范大学等机构创建。该数据集包含33,735个问题，涵盖14个核心临床场景，主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制，确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力，解决医疗领域中模型性能评估的不足问题。

arXiv 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据，收集自多个方言区域的本地方言使用者，涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件，单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别（ASR）和音频说话人识别。

hugging_face 收录

SADT 和 SEED-VIG|驾驶员疲劳监测数据集|生物信号处理数据集

基于深度迁移学习的跨数据集驾驶员疲劳识别基准

数据集概述

模型性能

相关文献

所需库

联系信息