five

cc2017_dataset|神经影像学数据集|视频帧分析数据集

收藏
huggingface2024-12-10 更新2024-12-12 收录
神经影像学
视频帧分析
下载链接:
https://huggingface.co/datasets/gongzx/cc2017_dataset
下载链接
链接失效反馈
资源简介:
这是一个预处理的fMRI数据集,包含从公共cc2017数据集中采样的视频帧。数据集包括不同受试者的fMRI数据(subj01~3_train/test_fmri.pt),这些数据经过Bonferroni校正(P < 0.05)筛选出显著的体素用于后续分析。此外,数据集还包括从cc2017数据集中的视频帧降采样到3FPS的版本(GT_train/test_3fps.pt),以及预处理的描述和它们的CLIP嵌入(GT_train/test_caption/emb.pt)。
创建时间:
2024-11-30
原始信息汇总

cc2017_dataset

数据集概述

该数据集包含预处理的功能性磁共振成像(fMRI)数据和从公共cc2017数据集中采样的视频帧,用于后续分析。

数据文件

  1. subj01~3_train/test_fmri.pt

    • 包含经过Bonferroni校正(P < 0.05)的显著体素,这些体素被认为是刺激激活的体素,用于后续分析。
    • 不同方法和受试者的体素数量对比:
      方法 受试者1 受试者2 受试者3
      MinD-Video 6016 6224 3744
      NeuroClips 13447 14828 9114
  2. GT_train/test_3fps.pt

    • 从cc2017数据集中提取的视频帧,从30FPS下采样到3FPS,以便与之前的方法进行公平比较。
  3. GT_train/test_caption/emb.pt

    • 包含预处理的描述文本及其来自BLIP-2的CLIP嵌入。

参考文献

  1. Wen, Haiguang, et al. "Neural encoding and decoding with deep learning for dynamic natural vision." Cerebral cortex 28.12 (2018): 4136-4160.
  2. Gong, Zixuan, et al. "NeuroClips: Towards High-fidelity and Smooth fMRI-to-Video Reconstruction." arXiv preprint arXiv:2410.19452 (2024).
AI搜集汇总
数据集介绍
main_image_url
构建方式
cc2017_dataset数据集的构建基于对公开的cc2017数据集的预处理,包括从视频中采样的fMRI数据和帧。具体而言,研究者采用了Bonferroni校正(P < 0.05)筛选出显著的体素,这些体素被认为是刺激激活的,并用于后续分析。此外,视频帧从30FPS下采样至3FPS,以确保与先前方法的公平比较。同时,数据集还包含了预处理的描述性文本及其对应的CLIP嵌入,这些嵌入来自BLIP-2模型。
特点
cc2017_dataset数据集的显著特点在于其结合了fMRI数据与视频帧的精细处理,确保了数据的高质量与分析的精确性。数据集中的体素选择经过严格的统计校正,确保了数据的可靠性。此外,视频帧的下采样处理和文本描述的嵌入处理,使得数据集在多模态分析中具有广泛的应用潜力。
使用方法
cc2017_dataset数据集适用于多模态神经影像分析,尤其是fMRI数据与视频帧的联合研究。研究者可以利用该数据集进行神经编码与解码的深度学习模型训练,以及视频重建等任务。数据集中的预处理文本和嵌入也为自然语言处理与视觉信息的结合提供了丰富的资源。
背景与挑战
背景概述
cc2017_dataset是一个经过预处理的fMRI数据集,源自公共的cc2017数据集,由Wen等人于2018年提出,主要用于研究动态自然视觉的神经编码与解码。该数据集的核心研究问题是通过深度学习技术,探索大脑如何处理和响应动态视觉刺激。数据集包含了从视频中采样的帧以及经过Bonferroni校正(P < 0.05)的显著体素数据,这些体素被认为是刺激激活的。此外,视频帧被下采样至3FPS,以与先前的方法进行公平比较。该数据集的创建为神经科学领域提供了宝贵的资源,特别是在fMRI-to-Video重建和神经编码解码方面,推动了相关研究的进展。
当前挑战
cc2017_dataset在构建和应用过程中面临多项挑战。首先,从fMRI数据中提取显著体素并进行Bonferroni校正,以确保数据的准确性和可靠性,这一过程需要高精度的数据处理技术。其次,视频帧的下采样至3FPS,虽然简化了数据处理,但也可能丢失部分动态信息,如何在不失真的前提下进行数据简化是一个重要挑战。此外,数据集中的预处理字幕及其CLIP嵌入,虽然为多模态学习提供了可能,但如何有效整合这些异质数据以提升模型性能,仍是一个亟待解决的问题。
常用场景
经典使用场景
cc2017_dataset 数据集的经典使用场景主要集中在功能性磁共振成像(fMRI)数据的分析与视频帧的关联研究。通过预处理后的fMRI数据和从公共cc2017数据集中采样的视频帧,研究者能够深入探索大脑对动态自然视觉刺激的响应机制。具体而言,该数据集支持对不同受试者的fMRI数据进行分析,识别出显著的体素(voxel),并将其与视频帧进行匹配,从而实现从大脑活动到视觉内容的解码。
解决学术问题
cc2017_dataset 数据集解决了神经科学领域中关于大脑如何编码和解码动态视觉信息的学术问题。通过提供预处理的fMRI数据和视频帧,该数据集为研究者提供了一个标准化的平台,用于验证和比较不同的神经解码方法。这不仅有助于理解大脑对视觉刺激的响应机制,还为开发高精度的fMRI-to-Video重建技术提供了基础,推动了神经科学和计算机视觉的交叉研究。
衍生相关工作
cc2017_dataset 数据集的发布催生了一系列相关研究工作,特别是在fMRI-to-Video重建和神经解码领域。例如,Gong等人提出的NeuroClips方法,通过高保真度和平滑的fMRI-to-Video重建,显著提升了重建视频的质量。此外,基于该数据集的研究还推动了深度学习在神经科学中的应用,促进了神经编码与解码模型的优化与创新。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

YOLO-dataset

该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。

github 收录