UnitRefine 数据集

github2025-02-10 更新2025-02-11 收录

下载链接：

https://github.com/anoushkajain/UnitRefine

下载链接

链接失效反馈

官方服务：

资源简介：

一个由7位专家对11个Neuropixels 1.0记录的小鼠数据进行手动注释的数据集，每个记录由2到5人进行标注，标注者之间的同意率为80%。

This dataset comprises 11 manually annotated mouse neural recordings obtained via Neuropixels 1.0 probes, overseen by seven experts. Each recording was labeled by 2 to 5 annotators, with an inter-annotator agreement rate of 80%.

创建时间：

2025-01-18

原始信息汇总

UnitRefine 数据集概述

数据集简介

数据集名称：UnitRefine
数据集用途：用于自动化尖峰排序审核，减少人工干预的需求。
主要特点：
- 与 SpikeInterface 无缝集成。
- 提供预训练的机器学习模型。
- 支持自定义模型训练。
- 方便地在 Hugging Face Hub 上分享和下载模型。
- 提供一个手动标注的数据集，由7位专家在11个Neuropixels 1.0记录上完成标注，小鼠作为实验对象。

关键特性

预训练模型：提供即用型分类器用于噪声移除和单元优化。
自定义训练：在自有数据上训练模型，满足特定实验需求。
集成：与SpikeInterface完全集成，提供流畅的用户体验。
模型共享：在 Hugging Face Hub 上共享或下载模型。
通用性：不依赖于探针类型、物种、大脑区域或尖峰排序器。

引用信息

DOI：https://doi.org/10.6084/m9.figshare.28282841.v2

快速入门

安装

确保环境中已安装 SpikeInterface，安装指南请参考：安装指南

教程

参考SpikeInterface文档中的自动化审核教程：自动化审核教程

参考脚本

包含两个脚本：model_based_curation.py 和 train_manual_curation.py，详细解释与SpikeInterface库集成的特定功能。

致谢

感谢以下个人为项目的贡献：Chris Halcrow、Jake Swann、Robyn Greene、Sangeetha Nandakumar、Nilufar Lahiji、Sacha Abou Rachid、Severin Graff、Luca Koenig、Natalia Babushkina、Simon Musall、Alessio Buccino、Matthias Hennig。

反馈与贡献

鼓励社区提供反馈、贡献和协作，以改进UnitRefine。欢迎提出问题和提交PR来增强工具箱。

搜集汇总

数据集介绍

构建方式

UnitRefine数据集的构建主要依托于机器学习技术，旨在通过减少人工干预来优化尖峰排序校准流程。该数据集包含了由7位专家对11个Neuropixels 1.0小鼠记录进行的手动标注，每个记录由2到5人进行注释，并实现了80%的标注者一致性，确保了数据集的质量和可靠性。

使用方法

使用UnitRefine数据集，用户首先需确保SpikeInterface已安装在环境中。接着，可以通过SpikeInterface文档中的自动化校准教程来入门，并利用提供的Jupyter Notebooks深入学习如何应用预训练模型和训练自定义分类器。此外，该数据集还提供了两个参考脚本，用于解释与SpikeInterface集成时特定功能的运作方式，但请注意，这些脚本不能独立使用，而是为了帮助理解SpikeInterface库相关功能的内部机制。

背景与挑战

背景概述

UnitRefine数据集，作为一个机器学习为基础的工具箱，旨在通过减少人工干预来简化尖峰排序校准过程。该数据集由7位专家针对11个Neuropixels 1.0小鼠记录进行了手动标注，标注者间的同意率为80%，体现了数据集的高质量与可靠性。UnitRefine的创建，得益于神经科学领域的研究人员，其核心研究问题聚焦于如何提高自动尖峰排序的准确性和效率。自发布以来，该数据集在神经科学界引起了广泛关注，对推进尖峰排序技术的发展起到了积极的推动作用。

当前挑战

尽管UnitRefine提供了预训练的机器学习模型以及自定义模型训练的灵活性，但构建过程中遇到的挑战主要包括：如何确保模型在不同探针类型、物种、大脑区域以及尖峰排序器之间的通用性；如何进一步提高模型的准确度和鲁棒性，以适应更广泛的实验需求；以及如何促进社区的贡献和模型的共享，以推动工具箱的不断进步和优化。这些挑战是UnitRefine发展过程中必须面对和解决的关键问题。

常用场景

经典使用场景

UnitRefine数据集作为自动化尖峰排序审核的工具箱，其经典使用场景在于通过减少手动干预的需求，从而优化神经信号处理流程。研究人员可利用其预训练的机器学习模型进行噪声消除和单元精炼，进而提高数据处理效率。

解决学术问题

该数据集解决了神经科学领域中手动尖峰排序耗时且易出错的问题，通过提供预训练模型及自定义模型训练功能，极大地提升了数据标注的准确性和一致性，为后续的神经科学研究奠定了坚实的数据基础。

实际应用

在实际应用中，UnitRefine数据集通过无缝集成SpikeInterface，使得研究人员能够更加便捷地在实验研究中应用该工具箱，其支持模型共享的特性也促进了学术界的交流与合作。

数据集最近研究