five

VadymV/EEG-semantic-text-relevance

收藏
Hugging Face2024-06-17 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/VadymV/EEG-semantic-text-relevance
下载链接
链接失效反馈
官方服务:
资源简介:
我们发布了一个包含23,270个时间锁定(0.7秒)单词级别EEG记录的数据集,这些记录来自15名参与者,他们阅读了与自选主题语义相关和不相关的文本。数据集的特征包括事件、单词、主题、选择主题、语义相关性、兴趣度、预知知识、句子编号、参与者和EEG数据。EEG数据的形状为32 x 2001。数据集可用于文本分类和标记分类任务,主要语言为英语。

我们发布了一个包含23,270个时间锁定(0.7秒)单词级别EEG记录的数据集,这些记录来自15名参与者,他们阅读了与自选主题语义相关和不相关的文本。数据集的特征包括事件、单词、主题、选择主题、语义相关性、兴趣度、预知知识、句子编号、参与者和EEG数据。EEG数据的形状为32 x 2001。数据集可用于文本分类和标记分类任务,主要语言为英语。
提供机构:
VadymV
原始信息汇总

数据集概述

数据集信息

  • 配置名称: cleaned
  • 特征:
    • event: 数据类型为 int64,表示 EEG 数据收集中的特定时间点,代表事件(单词的呈现)的开始。
    • word: 数据类型为 string,表示参与者阅读的单词。
    • topic: 数据类型为 string,表示单词所属文档的主题。
    • selected_topic: 数据类型为 string,表示参与者选择的主题。
    • semantic_relevance: 数据类型为 int64,表示单词是否在语义上与参与者选择的主题相关(1 表示相关,0 表示不相关)。
    • interestingness: 数据类型为 int64,表示参与者对文档主题的兴趣。
    • pre-knowledge: 数据类型为 int64,表示参与者对文档主题的先前知识。
    • sentence_number: 数据类型为 int64,表示单词所属的句子编号。
    • participant: 数据类型为 string,表示参与者。
    • eeg: 数据类型为 float64 的二维数组,形状为 [32, 2001],表示每个单词的脑电图记录。

数据分割

  • train: 包含 23,270 个样本,大小为 11,925,180,913 字节。

数据集大小

  • 下载大小: 11,927,979,870 字节
  • 数据集大小: 11,925,180,913 字节

配置

  • 配置名称: cleaned
  • 数据文件:
    • train: 路径为 cleaned/train-*
  • 默认配置: 是

许可

  • 许可: apache-2.0

任务类别

  • 文本分类
  • 标记分类

语言

  • 语言: 英语

标签

  • eeg
  • semantic relevance
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作