【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72
RefSeq(NCBI Reference Sequence Database)
收藏OpenDataLab2026-05-10 更新2024-05-25 收录
下载链接:
https://opendatalab.org.cn/OpenScienceLab/NCBI Reference-Sequence- Database
下载链接
链接失效反馈官方服务:
资源简介:
基因组、转录本和蛋白质序列参考序列数据库。
NCBI的参考序列 ( RefSeq ) 数据库是分类学上多样、非冗余且注释丰富的序列的集合,代表了自然产生的DNA、RNA和蛋白质分子。其中包括来自质粒、细胞器、病毒、古细菌、细菌和真核生物的序列。每个 RefSeq 都完全由提交给国际核苷酸序列数据库合作组织 (INSDC) 的序列数据构建。与评论文章类似,RefSeq 是在给定时间跨多个来源整合的信息的综合。RefSeq 为将序列数据与遗传和功能信息结合起来奠定了基础。它们的生成是为了为多种用途提供参考标准,从基因组注释到报告医疗记录中序列变异的位置。 RefSeq 集合不受限制,可以通过多种方式检索,例如通过搜索或通过 NCBI 资源中的可用链接,包括PubMed、核苷酸、蛋白质、基因和Map Viewer 、通过BLAST使用序列搜索以及从RefSeq FTP站点下载。
A reference sequence database for genomic, transcript, and protein sequences.
The Reference Sequence (RefSeq) database at NCBI is a collection of taxonomically diverse, non-redundant, and well-annotated sequences representing naturally occurring DNA, RNA, and protein molecules. This collection includes sequences from plasmids, organelles, viruses, archaea, bacteria, and eukaryotes. Every RefSeq entry is fully constructed from sequence data submitted to the International Nucleotide Sequence Database Collaboration (INSDC). Similar to review articles, RefSeq entries represent comprehensive integrations of information from multiple sources at a given time. RefSeq lays the foundation for integrating sequence data with genetic and functional information. They are developed to provide reference standards for a wide range of applications, from genome annotation to reporting the positions of sequence variants in medical records. The RefSeq collection is unrestricted and can be retrieved in multiple ways, such as through searches or via available links in NCBI resources including PubMed, Nucleotide, Protein, Gene, and Map Viewer, sequence searches using BLAST, and downloads from the RefSeq FTP site.
提供机构:
OpenScienceLab
创建时间:
2024-05-24
搜集汇总
数据集介绍

背景与挑战
背景概述
RefSeq是NCBI维护的一个权威参考序列数据库,提供基因组、转录本和蛋白质的非冗余、注释丰富的序列集合,涵盖病毒、细菌和真核生物等多种生物来源。该数据库规模达163.9GB,为生命科学研究提供了基础标准,支持基因组注释和序列变异分析等应用。
以上内容由遇见数据集搜集并总结生成



