scbench-data

Hugging Face2026-02-20 更新2026-02-21 收录

单细胞RNA测序

AI性能评估

数据链接：

https://huggingface.co/datasets/retroam/scbench-data 数据链接链接失效反馈

官方服务：

资源简介：

scBench Canonical Data Files 数据集包含用于 scBench 基准测试的 18 个 .h5ad 数据文件，涵盖 5 个平台（Chromium、CSGenetics、Illumina、MissionBio 和 ParseBio）和 7 个任务类别（质量控制、标准化、降维、聚类、细胞类型鉴定、差异表达分析和轨迹分析）。该数据集旨在评估 AI 代理在单细胞 RNA 测序数据分析中的性能，并提供确定性评分。数据集遵循 Apache 2.0 许可证，用户在使用时需引用相关论文。

创建时间：

2026-02-15

搜集汇总

数据集介绍

构建方式

在单细胞转录组学领域，数据集的构建质量直接决定了基准测试的可靠性与泛化能力。scbench-data数据集作为scBench基准测试的规范子集，其构建过程严格遵循了生物信息学实验设计原则。该数据集从Chromium、CSGenetics、Illumina、MissionBio和ParseBio这五个主流单细胞测序平台中，系统性地选取了代表性样本，涵盖了质量控制、标准化、降维、聚类、细胞分型、差异表达分析和轨迹推断等七类核心分析任务，最终形成了包含30个评估场景的18个.h5ad格式数据文件。这种跨平台、多任务的构建方式确保了数据集能够全面评估AI智能体在真实生物信息学工作流中的分析能力。

特点

scbench-data数据集的核心特点在于其针对智能体评估的专门化设计。与传统的静态基准数据集不同，该数据集紧密集成了inspect_evals评估框架，为AI智能体执行单细胞RNA-seq分析任务提供了结构化的、可自动化评分的测试环境。数据集文件采用AnnData（.h5ad）这一在单细胞生物信息学社区广泛使用的标准格式，确保了数据的互操作性和分析流程的复现性。其内容跨越多个实验平台，不仅反映了当前单细胞测序技术的多样性，也内置了从数据预处理到高级生物学解释的完整任务链条，为衡量智能体解决实际科研问题的综合性能提供了坚实的数据基础。

使用方法

使用scbench-data数据集进行智能体评估，需依托其原生的评估生态系统。研究人员首先需安装指定的评估工具库`inspect-evals`，随后通过命令行调用集成的scBench评估模块。典型的用法是指定一个待评估的AI模型，运行预设的评估流程，该流程将自动加载本数据集中的.h5ad文件，并向模型发起涵盖各类分析任务的挑战。评估系统会根据模型输出的代码或分析结果进行确定性评分，从而量化其生物信息学问题解决能力。这种端到端的评估方法使得该数据集不仅是静态数据的集合，更是一个动态的、标准化的智能体能力测试平台。

背景与挑战

背景概述

随着单细胞RNA测序技术的迅猛发展，生物信息学领域涌现出海量高维数据，对自动化分析工具的需求日益迫切。在此背景下，LatchBio研究团队于2025年推出了scBench数据集，旨在构建一个针对智能体驱动单细胞RNA-seq分析的基准测试平台。该数据集聚焦于评估人工智能代理在生物信息学实际任务中的执行能力，涵盖质量控管、标准化、降维、聚类、细胞分型、差异表达及轨迹分析等核心分析环节，涉及Chromium、CSGenetics、Illumina、MissionBio、ParseBio五大技术平台。通过提供规范化的.h5ad数据文件，scBench为单细胞分析方法的标准化比较与性能验证奠定了重要基础，推动了计算生物学向自动化、智能化方向的演进。

当前挑战

在单细胞RNA-seq分析领域，数据的高维度、稀疏性及技术平台间的批次效应构成了核心挑战，scBench旨在系统评估智能体能否稳健处理此类复杂生物信息学问题。构建过程中，研究团队需整合多平台、异质性强的原始数据，确保所选用的30项评估任务能全面覆盖从预处理到高级分析的完整流程，同时维持数据集的代表性与平衡性。此外，设计具有确定性评分机制的自动化评估框架亦是一大难点，需在保证结果可复现的前提下，精确量化智能体在各类任务上的性能表现，从而为算法开发提供可靠指引。

常用场景

经典使用场景

在单细胞转录组学领域，数据预处理与分析的标准化流程一直是研究的关键环节。scbench-data数据集作为scBench基准测试的规范子集，其经典使用场景在于为人工智能代理在单细胞RNA-seq分析任务中的性能评估提供统一的数据基础。研究人员利用该数据集包含的30项评估任务，系统性地测试AI代理在质量控制、标准化、降维、聚类、细胞分型、差异表达分析和轨迹推断等多个核心分析步骤上的能力，从而在可控环境中验证算法或智能体的可靠性与准确性。

衍生相关工作

围绕scbench-data数据集及其所属的scBench基准，已衍生出一系列关注于单细胞数据分析自动化与智能代理评估的经典研究工作。这些工作通常聚焦于如何设计更高效的AI代理架构来应对数据预处理、细胞注释和轨迹推断等复杂挑战，或者探索将大型语言模型与领域知识相结合以理解并执行生物信息学工作流。该基准也激励了社区开发与之兼容的新型评估指标和任务，共同推动着智能计算在单细胞组学领域的深入应用。

数据集最近研究

scbench-data

资源简介：

相关数据集