Multi-Omics Resources for Translational Medicine Research
收藏github2023-08-25 更新2024-05-31 收录
下载链接:
https://github.com/th86/transmeddatasets
下载链接
链接失效反馈官方服务:
资源简介:
为转化医学研究提供的公共多组学资源,包括基因表达、序列读取、基因型与表型数据库等。
A public multi-omics resource for translational research, encompassing gene expression, sequence reads, genotype and phenotype databases, among others.
创建时间:
2017-04-21
原始信息汇总
数据集概述
一般组学数据集
- NCBI GEO: Gene Expression Omnibus
- NCBI SRA: Sequence Read Archive
- NCBI dbGaP: The database of Genotypes and Phenotypes
- NCBI dbVar: Human Structural Variant Data Hub
- EMBL-EBI EGA: European Genome-phenome Archive
- EMBL-EBI ArrayExpress: Functional Genomics Data
- BioGPS: BioGPS Dataset Library
- recount2: Analysis-Ready RNA-seq Gene and Exon Counts Datasets
- UCSC Xena Data Hubs: Normalized Public Omics Data Hubs with UCSCs own Data Sets
疾病数据集
- NCI Data Catalog: Data Collections Produced by Major NCI Initiatives
- TCGA: The Cancer Genome Atlas
- ICGC: The International Cancer Genome Consortium
- CCLE: The Cancer Cell Line Encyclopedia
- cBioPortal for Cancer Genomics
- METABRIC: The Genomic Profiles of 2,509 Breast Cancers
- Broad Institute Cancer Program Datasets
- GENIE: The AACR Project Genomics, Evidence, Neoplasia, Information, Exchange
- MSK-IMPACT: Targeted Sequencing of 10,000 Metastatic Cancer Cases
- PCGP: Pediatric Cancer Genome Project
- HAS: The Hungarian Academy of Science Breast Cancer and Ovarian Cancer Data Sets
- SMRI: Stanley Medical Research Institute Brain Research Data Sets
- SFARI-SSC: Simons Simplex Collection of Autism
- PsychENCODE: The Psychiatric Disease Brain Data Sets
参考模型数据库
- EMBL-EBI Ensembl: Reference Genome Assembly
- NHGRI GENCODE: Encyclopedia of Genes and Gene Variants
- NHGRI ENCODE: Encyclopedia of DNA Elements
- GTEx: The Genotype-Tissue Expression Project
- 1KGP: The 1000 Genomes Project
- The 1000 Genomes TagSNP Database
- IGP: The Immunological Genome Project
- HPA: The Human Protein Atlas
- ClinGen: The Clinical Genome Resource
- PGKB: The Pharmacogenomixs Knowledgebase
- CPIC: The Clinical Pharmacogenetics Implementation Consortium
- OncoKB: Precision Oncology Knowledge Base
- Allen Institute Human Brains: Bulk Transcriptomts from Healthy Human Donor Brains
单细胞组学数据集
- Broad Institute Single Cell Portal: Single Cell Transcriptomes of Oligodendroglima/Astrocytoma/Melanoma
- NYGC Satija Lab: 2,700 + 33,000 blood cells
- NYU Yanai Lab: 8,500 pancrea cells
- 10X Genomics: Single Cell Gene Expression Datasets
- JingleBells: A Repository of Standardized Single Cell RNA-Seq Datasets
- Salk Institute Human and Mouse Frontal Cortex Methylomes: Single Cell Methylomes of 3,377 and 2,784 Neurons from the Frontal Cortex of Mice and a Human
- Allen Brain Atlas: 15,928 Single Cell Transcriptomes from Four Postmortem Donor Brains and Four Neurosurgical Donor Brains
- UCSD Brain Single Cells: >60,000 Single Nucleus Transcriptomes and Single Cell DNA Accessibility Maps of Human Adult Brain Cells
- HCA: The Human Cell Atlas. The data of 30,000,000+ cells is not available yet.
- FlowRepository: Database of flow cytometry experiments
流行病学
- NCI SEER: Cancer Surveillance, Epidemiology, and End Result Program
在线工具
- UCSC Genome Browser
- NCBI BLAST: Basic Local Alignment Search Tool
- Broad Institute GSEA: Gene Set Enrichment Analysis
- NCBI GDP: Genome Decoration Page
资源
- NCBI PubMed
- NCBI Handbook
- NCBI All Resources
- OMICtools
- Bioconductor Workflows
- RNA-Seq Blog: Transcriptome Sequencing Research & Industry News
- University of Pittsburgh OBRC: Online Bioinformatics Resources Collection
- Dr. Andrew Kropinskis Internet Resources for Molecular Biologists
搜集汇总
数据集介绍

构建方式
Multi-Omics Resources for Translational Medicine Research数据集通过整合多个权威的生物信息学数据库和资源构建而成,涵盖了基因组学、转录组学、蛋白质组学等多个组学领域的数据。这些数据来源于NCBI GEO、EMBL-EBI EGA、TCGA等国际知名的数据平台,确保了数据的广泛性和权威性。数据集的构建过程严格遵循国际标准,确保了数据的可重复性和可验证性。
特点
该数据集的特点在于其多组学数据的全面性和多样性,涵盖了从基因表达、序列读取到癌症基因组等多个领域的数据。数据集不仅包含了大量的公共数据资源,还整合了疾病相关的特定数据集,如癌症基因组图谱(TCGA)和国际癌症基因组联盟(ICGC)的数据。此外,数据集还提供了单细胞组学数据,为研究者提供了从单细胞水平解析复杂生物系统的机会。
使用方法
该数据集的使用方法多样,研究者可以通过访问数据集提供的链接直接获取所需的数据资源。数据集中的每个数据源都附有详细的描述和访问指南,用户可以根据研究需求选择合适的数据集进行下载和分析。此外,数据集还提供了多种在线工具和资源,如UCSC Genome Browser和NCBI BLAST,帮助用户进行数据分析和可视化。通过结合这些工具,研究者可以更高效地进行多组学数据的整合分析,推动转化医学研究的进展。
背景与挑战
背景概述
Multi-Omics Resources for Translational Medicine Research数据集由多个国际知名生物信息学研究机构共同创建,旨在整合多组学数据以推动转化医学研究。该数据集涵盖了基因组学、转录组学、蛋白质组学等多个层面的数据,主要研究人员包括来自NCBI、EMBL-EBI、Broad研究所等机构的科学家。其核心研究问题在于如何通过多组学数据的整合分析,揭示疾病的发生机制并推动精准医疗的发展。该数据集自发布以来,已成为癌症、神经科学、免疫学等领域的重要研究资源,极大地促进了多组学数据在临床研究中的应用。
当前挑战
Multi-Omics Resources for Translational Medicine Research数据集在解决多组学数据整合与分析的领域问题上,面临诸多挑战。首先,多组学数据的异质性使得数据标准化和整合成为难题,不同来源的数据格式、实验条件和分析方法差异显著。其次,数据规模庞大且复杂,对计算资源和算法提出了极高要求,尤其是在单细胞组学数据和高通量测序数据的处理上。此外,数据隐私和伦理问题也是构建过程中不可忽视的挑战,尤其是在涉及人类基因组和临床数据时,如何确保数据的安全共享与合规使用成为关键。
常用场景
经典使用场景
Multi-Omics Resources for Translational Medicine Research数据集在生物医学研究中扮演着至关重要的角色,尤其是在多组学数据的整合与分析方面。该数据集广泛应用于基因组学、转录组学、蛋白质组学等多个领域,为研究人员提供了一个全面的数据平台,用于探索基因表达、突变、表观遗传修饰等复杂生物学过程。通过整合来自不同组学层次的数据,研究人员能够更全面地理解疾病的分子机制,从而推动精准医学的发展。
解决学术问题
该数据集解决了生物医学研究中多组学数据整合的难题,尤其是在癌症研究、神经科学和免疫学等领域。通过提供高质量的基因组、转录组和蛋白质组数据,研究人员能够更深入地解析疾病的分子基础,识别潜在的生物标志物和治疗靶点。此外,该数据集还为复杂疾病的异质性研究提供了重要支持,帮助科学家们更好地理解疾病的多样性和个体化治疗的可能性。
衍生相关工作
基于Multi-Omics Resources for Translational Medicine Research数据集,衍生出了许多经典的研究工作。例如,癌症基因组图谱(TCGA)项目利用该数据集中的多组学数据,系统地分析了多种癌症的基因组特征,揭示了癌症的分子异质性。此外,GTEx项目利用该数据集中的基因表达数据,研究了基因在不同组织中的表达模式,为理解基因功能和组织特异性提供了重要线索。这些研究不仅推动了基础生物学的发展,还为临床医学的进步提供了有力支持。
以上内容由遇见数据集搜集并总结生成



