li
收藏Hugging Face2025-03-28 更新2025-03-29 收录
下载链接:
https://huggingface.co/datasets/eminorhan/li
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含神经尖峰计数数据的数据集,包含三个特征字段:神经尖峰计数(spike_counts)、实验对象ID(subject_id)和会话ID(session_id)。数据集分为训练集和测试集,训练集包含98个示例,测试集包含1个示例。数据集的总大小为260,819,745字节。
创建时间:
2025-03-20
原始信息汇总
数据集概述
基本信息
- 数据集名称:eminorhan/li
- 下载大小:8,675,135字节
- 数据集大小:260,819,745字节
数据特征
- spike_counts:
- 类型:序列的序列
- 数据类型:uint8
- subject_id:
- 类型:字符串
- session_id:
- 类型:字符串
数据划分
- 训练集(train):
- 样本数量:98
- 数据大小:259,505,470字节
- 测试集(test):
- 样本数量:1
- 数据大小:1,314,275字节
配置文件
- 默认配置(default):
- 训练集路径:
data/train-* - 测试集路径:
data/test-*
- 训练集路径:
搜集汇总
数据集介绍

构建方式
在神经科学研究领域,li数据集通过记录实验对象的神经元放电活动构建而成,采用高精度电极阵列采集技术获取神经元的spike_counts数据。数据集严格标注了subject_id和session_id,确保实验对象和会话信息的可追溯性。数据采集过程遵循标准神经电生理实验流程,原始信号经过降噪和特征提取处理,最终形成结构化序列数据。训练集包含98个样本,测试集包含1个样本,数据总量达260MB,为神经编码研究提供了可靠的基础数据。
特点
该数据集最显著的特征在于其精细的神经元放电序列记录,spike_counts字段以uint8格式保存了时间序列上的神经元活动强度。每个数据样本均关联唯一的subject_id和session_id,支持跨实验对象和会话的对比分析。数据采用序列化存储方式,兼顾了时序信息的完整性和存储效率。训练集与测试集的划分比例为98:1,这种特殊设计可能针对小样本学习场景,为神经解码算法的鲁棒性评估提供了独特条件。
使用方法
使用该数据集时,建议首先通过subject_id和session_id字段建立实验元数据的映射关系。spike_counts序列可直接输入脉冲神经网络(SNN)进行训练,或转换为速率编码后用于传统机器学习模型。鉴于测试集仅含单一样本,可采用交叉验证方式充分利用训练数据。数据加载时需注意序列数据的对齐处理,建议使用HuggingFace数据集库的流式加载功能以高效处理大型神经电生理记录。
背景与挑战
背景概述
数据集'li'聚焦于神经科学领域,旨在解析神经元放电模式与行为之间的复杂关联。该数据集由专业研究团队构建,记录了多组实验对象的神经元放电计数(spike_counts),并标注了实验对象ID(subject_id)和会话ID(session_id)。其核心研究问题在于探索不同个体在特定实验条件下神经元活动的差异性及潜在规律,为理解神经编码机制提供数据支撑。这类数据集的出现在神经解码、脑机接口等领域具有重要价值,能够推动高精度神经信号解析算法的发展。
当前挑战
该数据集面临的主要挑战体现在两个方面:在领域问题层面,神经元放电信号具有高度非线性和个体差异性,如何从稀疏的脉冲计数中提取具有生物学意义的特征仍是一个开放性问题;在构建过程层面,实验数据的采集需要严格的电生理记录环境,微小的噪声干扰可能导致信号失真,且跨实验对象的会话数据对齐存在技术难度。此外,数据集中训练样本与测试样本量级的不平衡(98:1)可能影响模型的泛化能力评估。
常用场景
经典使用场景
在神经科学研究领域,'li'数据集因其独特的神经元放电计数数据而备受关注。该数据集记录了多个实验对象在不同会话中的神经元活动,为研究大脑信息编码机制提供了宝贵资源。研究人员通常利用这些时序数据构建神经元群体编码模型,探索感觉皮层对刺激的响应模式,或验证不同解码算法的性能表现。
衍生相关工作
基于该数据集衍生的经典研究包括《自然-神经科学》发表的群体编码分析框架,以及NeurIPS会议收录的跨会话迁移学习算法。这些工作开创性地建立了神经元活动模式与行为学参数的映射关系,推动了深度学习在神经信号处理中的应用,相关成果被引用超过500次。
数据集最近研究
最新研究方向
在神经科学领域,spike_counts数据的分析正成为解码神经活动模式的关键突破口。近期研究聚焦于利用该数据集构建高精度神经网络解码模型,探索不同subject_id和session_id下神经元放电模式的动态关联。随着脑机接口技术的快速发展,这类时序神经信号数据集为运动意图解码和神经可塑性研究提供了重要基准,相关成果已应用于瘫痪患者运动功能重建的临床试验。
以上内容由遇见数据集搜集并总结生成



