cc2017_dataset

Hugging Face2024-12-10 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/gongzx/cc2017_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个预处理的fMRI数据集，包含从公共cc2017数据集中采样的视频帧。数据集包括不同受试者的fMRI数据（subj01~3_train/test_fmri.pt），这些数据经过Bonferroni校正（P < 0.05）筛选出显著的体素用于后续分析。此外，数据集还包括从cc2017数据集中的视频帧降采样到3FPS的版本（GT_train/test_3fps.pt），以及预处理的描述和它们的CLIP嵌入（GT_train/test_caption/emb.pt）。

创建时间：

2024-11-30

原始信息汇总

cc2017_dataset

数据集概述

该数据集包含预处理的功能性磁共振成像（fMRI）数据和从公共cc2017数据集中采样的视频帧，用于后续分析。

数据文件

subj01~3_train/test_fmri.pt
- 包含经过Bonferroni校正（P < 0.05）的显著体素，这些体素被认为是刺激激活的体素，用于后续分析。
- 不同方法和受试者的体素数量对比：
  
  方法受试者1 受试者2 受试者3
  
  MinD-Video 6016 6224 3744
  
  NeuroClips 13447 14828 9114
GT_train/test_3fps.pt
- 从cc2017数据集中提取的视频帧，从30FPS下采样到3FPS，以便与之前的方法进行公平比较。
GT_train/test_caption/emb.pt
- 包含预处理的描述文本及其来自BLIP-2的CLIP嵌入。

参考文献

Wen, Haiguang, et al. "Neural encoding and decoding with deep learning for dynamic natural vision." Cerebral cortex 28.12 (2018): 4136-4160.
Gong, Zixuan, et al. "NeuroClips: Towards High-fidelity and Smooth fMRI-to-Video Reconstruction." arXiv preprint arXiv:2410.19452 (2024).

搜集汇总

数据集介绍

构建方式

cc2017_dataset数据集的构建基于对公开的cc2017数据集的预处理，包括从视频中采样的fMRI数据和帧。具体而言，研究者采用了Bonferroni校正（P < 0.05）筛选出显著的体素，这些体素被认为是刺激激活的，并用于后续分析。此外，视频帧从30FPS下采样至3FPS，以确保与先前方法的公平比较。同时，数据集还包含了预处理的描述性文本及其对应的CLIP嵌入，这些嵌入来自BLIP-2模型。

特点

cc2017_dataset数据集的显著特点在于其结合了fMRI数据与视频帧的精细处理，确保了数据的高质量与分析的精确性。数据集中的体素选择经过严格的统计校正，确保了数据的可靠性。此外，视频帧的下采样处理和文本描述的嵌入处理，使得数据集在多模态分析中具有广泛的应用潜力。

使用方法

cc2017_dataset数据集适用于多模态神经影像分析，尤其是fMRI数据与视频帧的联合研究。研究者可以利用该数据集进行神经编码与解码的深度学习模型训练，以及视频重建等任务。数据集中的预处理文本和嵌入也为自然语言处理与视觉信息的结合提供了丰富的资源。

背景与挑战

背景概述

cc2017_dataset是一个经过预处理的fMRI数据集，源自公共的cc2017数据集，由Wen等人于2018年提出，主要用于研究动态自然视觉的神经编码与解码。该数据集的核心研究问题是通过深度学习技术，探索大脑如何处理和响应动态视觉刺激。数据集包含了从视频中采样的帧以及经过Bonferroni校正（P < 0.05）的显著体素数据，这些体素被认为是刺激激活的。此外，视频帧被下采样至3FPS，以与先前的方法进行公平比较。该数据集的创建为神经科学领域提供了宝贵的资源，特别是在fMRI-to-Video重建和神经编码解码方面，推动了相关研究的进展。

当前挑战

cc2017_dataset在构建和应用过程中面临多项挑战。首先，从fMRI数据中提取显著体素并进行Bonferroni校正，以确保数据的准确性和可靠性，这一过程需要高精度的数据处理技术。其次，视频帧的下采样至3FPS，虽然简化了数据处理，但也可能丢失部分动态信息，如何在不失真的前提下进行数据简化是一个重要挑战。此外，数据集中的预处理字幕及其CLIP嵌入，虽然为多模态学习提供了可能，但如何有效整合这些异质数据以提升模型性能，仍是一个亟待解决的问题。

常用场景

经典使用场景

cc2017_dataset 数据集的经典使用场景主要集中在功能性磁共振成像（fMRI）数据的分析与视频帧的关联研究。通过预处理后的fMRI数据和从公共cc2017数据集中采样的视频帧，研究者能够深入探索大脑对动态自然视觉刺激的响应机制。具体而言，该数据集支持对不同受试者的fMRI数据进行分析，识别出显著的体素（voxel），并将其与视频帧进行匹配，从而实现从大脑活动到视觉内容的解码。

解决学术问题

cc2017_dataset 数据集解决了神经科学领域中关于大脑如何编码和解码动态视觉信息的学术问题。通过提供预处理的fMRI数据和视频帧，该数据集为研究者提供了一个标准化的平台，用于验证和比较不同的神经解码方法。这不仅有助于理解大脑对视觉刺激的响应机制，还为开发高精度的fMRI-to-Video重建技术提供了基础，推动了神经科学和计算机视觉的交叉研究。

衍生相关工作

cc2017_dataset 数据集的发布催生了一系列相关研究工作，特别是在fMRI-to-Video重建和神经解码领域。例如，Gong等人提出的NeuroClips方法，通过高保真度和平滑的fMRI-to-Video重建，显著提升了重建视频的质量。此外，基于该数据集的研究还推动了深度学习在神经科学中的应用，促进了神经编码与解码模型的优化与创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集

方法	受试者1	受试者2	受试者3
MinD-Video	6016	6224	3744
NeuroClips	13447	14828	9114