VadymV/EEG-semantic-text-relevance
收藏Hugging Face2024-06-17 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/VadymV/EEG-semantic-text-relevance
下载链接
链接失效反馈官方服务:
资源简介:
我们发布了一个包含23,270个时间锁定(0.7秒)单词级别EEG记录的数据集,这些记录来自15名参与者,他们阅读了与自选主题语义相关和不相关的文本。数据集的特征包括事件、单词、主题、选择主题、语义相关性、兴趣度、预知知识、句子编号、参与者和EEG数据。EEG数据的形状为32 x 2001。数据集可用于文本分类和标记分类任务,主要语言为英语。
我们发布了一个包含23,270个时间锁定(0.7秒)单词级别EEG记录的数据集,这些记录来自15名参与者,他们阅读了与自选主题语义相关和不相关的文本。数据集的特征包括事件、单词、主题、选择主题、语义相关性、兴趣度、预知知识、句子编号、参与者和EEG数据。EEG数据的形状为32 x 2001。数据集可用于文本分类和标记分类任务,主要语言为英语。
提供机构:
VadymV
原始信息汇总
数据集概述
数据集信息
- 配置名称: cleaned
- 特征:
- event: 数据类型为
int64,表示 EEG 数据收集中的特定时间点,代表事件(单词的呈现)的开始。 - word: 数据类型为
string,表示参与者阅读的单词。 - topic: 数据类型为
string,表示单词所属文档的主题。 - selected_topic: 数据类型为
string,表示参与者选择的主题。 - semantic_relevance: 数据类型为
int64,表示单词是否在语义上与参与者选择的主题相关(1 表示相关,0 表示不相关)。 - interestingness: 数据类型为
int64,表示参与者对文档主题的兴趣。 - pre-knowledge: 数据类型为
int64,表示参与者对文档主题的先前知识。 - sentence_number: 数据类型为
int64,表示单词所属的句子编号。 - participant: 数据类型为
string,表示参与者。 - eeg: 数据类型为
float64的二维数组,形状为[32, 2001],表示每个单词的脑电图记录。
- event: 数据类型为
数据分割
- train: 包含 23,270 个样本,大小为 11,925,180,913 字节。
数据集大小
- 下载大小: 11,927,979,870 字节
- 数据集大小: 11,925,180,913 字节
配置
- 配置名称: cleaned
- 数据文件:
- train: 路径为
cleaned/train-*
- train: 路径为
- 默认配置: 是
许可
- 许可: apache-2.0
任务类别
- 文本分类
- 标记分类
语言
- 语言: 英语
标签
- eeg
- semantic relevance



