VadymV/EEG-semantic-text-relevance

Name: VadymV/EEG-semantic-text-relevance
Creator: VadymV
Published: 2024-06-17 12:43:36
License: 暂无描述

Hugging Face2024-06-17 更新2024-06-25 收录

下载链接：

https://hf-mirror.com/datasets/VadymV/EEG-semantic-text-relevance

下载链接

链接失效反馈

官方服务：

资源简介：

我们发布了一个包含23,270个时间锁定（0.7秒）单词级别EEG记录的数据集，这些记录来自15名参与者，他们阅读了与自选主题语义相关和不相关的文本。数据集的特征包括事件、单词、主题、选择主题、语义相关性、兴趣度、预知知识、句子编号、参与者和EEG数据。EEG数据的形状为32 x 2001。数据集可用于文本分类和标记分类任务，主要语言为英语。

提供机构：

VadymV

原始信息汇总

数据集概述

数据集信息

配置名称: cleaned
特征:
- event: 数据类型为 int64，表示 EEG 数据收集中的特定时间点，代表事件（单词的呈现）的开始。
- word: 数据类型为 string，表示参与者阅读的单词。
- topic: 数据类型为 string，表示单词所属文档的主题。
- selected_topic: 数据类型为 string，表示参与者选择的主题。
- semantic_relevance: 数据类型为 int64，表示单词是否在语义上与参与者选择的主题相关（1 表示相关，0 表示不相关）。
- interestingness: 数据类型为 int64，表示参与者对文档主题的兴趣。
- pre-knowledge: 数据类型为 int64，表示参与者对文档主题的先前知识。
- sentence_number: 数据类型为 int64，表示单词所属的句子编号。
- participant: 数据类型为 string，表示参与者。
- eeg: 数据类型为 float64 的二维数组，形状为 [32, 2001]，表示每个单词的脑电图记录。

数据分割

train: 包含 23,270 个样本，大小为 11,925,180,913 字节。

数据集大小

下载大小: 11,927,979,870 字节
数据集大小: 11,925,180,913 字节

配置

配置名称: cleaned
数据文件:
- train: 路径为 cleaned/train-*
默认配置: 是

许可

许可: apache-2.0

任务类别

文本分类
标记分类

语言

语言: 英语