human_reference_genome
收藏OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/AIWizards/human_reference_genome?tab=summary
下载链接
链接失效反馈官方服务:
资源简介:
人类参考基因组数据集,核心定位在于提供人类基因组序列数据,包含来自参考组装GRCh38/hg38的常染色体和性染色体序列,总计32亿个核苷酸。该数据集已被用于预训练核苷酸转换器模型,并提供标准化数据操作,方便用户获取染色体、核苷酸位置等信息。数据集分为训练集、验证集和测试集,并提供不同长度(6200或12200个碱基对)的序列实例。每个实例包含序列字符串、染色体信息以及起始和结束核苷酸的索引位置。
提供机构:
AIWizards
创建时间:
2024-07-19



