five

MPRG/Mouse-Genecorpus-20M

收藏
Hugging Face2025-02-24 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/MPRG/Mouse-Genecorpus-20M
下载链接
链接失效反馈
官方服务:
资源简介:
Mouse-Genecorpus-20M是一个大规模预训练语料库,包含约2100万个小鼠单细胞转录组,数据来源于公开的多种组织。该语料库用于预训练Mouse-Geneformer,这是一个能够在网络生物学中在数据有限的情况下进行上下文感知预测的预训练变压器模型。

Mouse-Genecorpus-20M is a large-scale pretraining corpus comprised of ~21 million mouse single cell transcriptomes from a broad range of tissues from publicly available data. This corpus is used for pretraining Mouse-Geneformer, a pretrained transformer model that enables context-aware predictions in settings with limited data in network biology.
提供机构:
MPRG
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作