five

Multi-Omics Resources for Translational Medicine Research

收藏
github2023-08-25 更新2024-05-31 收录
下载链接:
https://github.com/th86/transmeddatasets
下载链接
链接失效反馈
官方服务:
资源简介:
为转化医学研究提供的公共多组学资源,包括基因表达、序列读取、基因型与表型数据库等。

A public multi-omics resource for translational research, encompassing gene expression, sequence reads, genotype and phenotype databases, among others.
创建时间:
2017-04-21
原始信息汇总

数据集概述

一般组学数据集

  • NCBI GEO: Gene Expression Omnibus
  • NCBI SRA: Sequence Read Archive
  • NCBI dbGaP: The database of Genotypes and Phenotypes
  • NCBI dbVar: Human Structural Variant Data Hub
  • EMBL-EBI EGA: European Genome-phenome Archive
  • EMBL-EBI ArrayExpress: Functional Genomics Data
  • BioGPS: BioGPS Dataset Library
  • recount2: Analysis-Ready RNA-seq Gene and Exon Counts Datasets
  • UCSC Xena Data Hubs: Normalized Public Omics Data Hubs with UCSCs own Data Sets

疾病数据集

  • NCI Data Catalog: Data Collections Produced by Major NCI Initiatives
  • TCGA: The Cancer Genome Atlas
  • ICGC: The International Cancer Genome Consortium
  • CCLE: The Cancer Cell Line Encyclopedia
  • cBioPortal for Cancer Genomics
  • METABRIC: The Genomic Profiles of 2,509 Breast Cancers
  • Broad Institute Cancer Program Datasets
  • GENIE: The AACR Project Genomics, Evidence, Neoplasia, Information, Exchange
  • MSK-IMPACT: Targeted Sequencing of 10,000 Metastatic Cancer Cases
  • PCGP: Pediatric Cancer Genome Project
  • HAS: The Hungarian Academy of Science Breast Cancer and Ovarian Cancer Data Sets
  • SMRI: Stanley Medical Research Institute Brain Research Data Sets
  • SFARI-SSC: Simons Simplex Collection of Autism
  • PsychENCODE: The Psychiatric Disease Brain Data Sets

参考模型数据库

  • EMBL-EBI Ensembl: Reference Genome Assembly
  • NHGRI GENCODE: Encyclopedia of Genes and Gene Variants
  • NHGRI ENCODE: Encyclopedia of DNA Elements
  • GTEx: The Genotype-Tissue Expression Project
  • 1KGP: The 1000 Genomes Project
  • The 1000 Genomes TagSNP Database
  • IGP: The Immunological Genome Project
  • HPA: The Human Protein Atlas
  • ClinGen: The Clinical Genome Resource
  • PGKB: The Pharmacogenomixs Knowledgebase
  • CPIC: The Clinical Pharmacogenetics Implementation Consortium
  • OncoKB: Precision Oncology Knowledge Base
  • Allen Institute Human Brains: Bulk Transcriptomts from Healthy Human Donor Brains

单细胞组学数据集

  • Broad Institute Single Cell Portal: Single Cell Transcriptomes of Oligodendroglima/Astrocytoma/Melanoma
  • NYGC Satija Lab: 2,700 + 33,000 blood cells
  • NYU Yanai Lab: 8,500 pancrea cells
  • 10X Genomics: Single Cell Gene Expression Datasets
  • JingleBells: A Repository of Standardized Single Cell RNA-Seq Datasets
  • Salk Institute Human and Mouse Frontal Cortex Methylomes: Single Cell Methylomes of 3,377 and 2,784 Neurons from the Frontal Cortex of Mice and a Human
  • Allen Brain Atlas: 15,928 Single Cell Transcriptomes from Four Postmortem Donor Brains and Four Neurosurgical Donor Brains
  • UCSD Brain Single Cells: >60,000 Single Nucleus Transcriptomes and Single Cell DNA Accessibility Maps of Human Adult Brain Cells
  • HCA: The Human Cell Atlas. The data of 30,000,000+ cells is not available yet.
  • FlowRepository: Database of flow cytometry experiments

流行病学

  • NCI SEER: Cancer Surveillance, Epidemiology, and End Result Program

在线工具

  • UCSC Genome Browser
  • NCBI BLAST: Basic Local Alignment Search Tool
  • Broad Institute GSEA: Gene Set Enrichment Analysis
  • NCBI GDP: Genome Decoration Page

资源

  • NCBI PubMed
  • NCBI Handbook
  • NCBI All Resources
  • OMICtools
  • Bioconductor Workflows
  • RNA-Seq Blog: Transcriptome Sequencing Research & Industry News
  • University of Pittsburgh OBRC: Online Bioinformatics Resources Collection
  • Dr. Andrew Kropinskis Internet Resources for Molecular Biologists
搜集汇总
数据集介绍
main_image_url
构建方式
Multi-Omics Resources for Translational Medicine Research数据集通过整合多个权威的生物信息学数据库和资源构建而成,涵盖了基因组学、转录组学、蛋白质组学等多个组学领域的数据。这些数据来源于NCBI GEO、EMBL-EBI EGA、TCGA等国际知名的数据平台,确保了数据的广泛性和权威性。数据集的构建过程严格遵循国际标准,确保了数据的可重复性和可验证性。
特点
该数据集的特点在于其多组学数据的全面性和多样性,涵盖了从基因表达、序列读取到癌症基因组等多个领域的数据。数据集不仅包含了大量的公共数据资源,还整合了疾病相关的特定数据集,如癌症基因组图谱(TCGA)和国际癌症基因组联盟(ICGC)的数据。此外,数据集还提供了单细胞组学数据,为研究者提供了从单细胞水平解析复杂生物系统的机会。
使用方法
该数据集的使用方法多样,研究者可以通过访问数据集提供的链接直接获取所需的数据资源。数据集中的每个数据源都附有详细的描述和访问指南,用户可以根据研究需求选择合适的数据集进行下载和分析。此外,数据集还提供了多种在线工具和资源,如UCSC Genome Browser和NCBI BLAST,帮助用户进行数据分析和可视化。通过结合这些工具,研究者可以更高效地进行多组学数据的整合分析,推动转化医学研究的进展。
背景与挑战
背景概述
Multi-Omics Resources for Translational Medicine Research数据集由多个国际知名生物信息学研究机构共同创建,旨在整合多组学数据以推动转化医学研究。该数据集涵盖了基因组学、转录组学、蛋白质组学等多个层面的数据,主要研究人员包括来自NCBI、EMBL-EBI、Broad研究所等机构的科学家。其核心研究问题在于如何通过多组学数据的整合分析,揭示疾病的发生机制并推动精准医疗的发展。该数据集自发布以来,已成为癌症、神经科学、免疫学等领域的重要研究资源,极大地促进了多组学数据在临床研究中的应用。
当前挑战
Multi-Omics Resources for Translational Medicine Research数据集在解决多组学数据整合与分析的领域问题上,面临诸多挑战。首先,多组学数据的异质性使得数据标准化和整合成为难题,不同来源的数据格式、实验条件和分析方法差异显著。其次,数据规模庞大且复杂,对计算资源和算法提出了极高要求,尤其是在单细胞组学数据和高通量测序数据的处理上。此外,数据隐私和伦理问题也是构建过程中不可忽视的挑战,尤其是在涉及人类基因组和临床数据时,如何确保数据的安全共享与合规使用成为关键。
常用场景
经典使用场景
Multi-Omics Resources for Translational Medicine Research数据集在生物医学研究中扮演着至关重要的角色,尤其是在多组学数据的整合与分析方面。该数据集广泛应用于基因组学、转录组学、蛋白质组学等多个领域,为研究人员提供了一个全面的数据平台,用于探索基因表达、突变、表观遗传修饰等复杂生物学过程。通过整合来自不同组学层次的数据,研究人员能够更全面地理解疾病的分子机制,从而推动精准医学的发展。
解决学术问题
该数据集解决了生物医学研究中多组学数据整合的难题,尤其是在癌症研究、神经科学和免疫学等领域。通过提供高质量的基因组、转录组和蛋白质组数据,研究人员能够更深入地解析疾病的分子基础,识别潜在的生物标志物和治疗靶点。此外,该数据集还为复杂疾病的异质性研究提供了重要支持,帮助科学家们更好地理解疾病的多样性和个体化治疗的可能性。
衍生相关工作
基于Multi-Omics Resources for Translational Medicine Research数据集,衍生出了许多经典的研究工作。例如,癌症基因组图谱(TCGA)项目利用该数据集中的多组学数据,系统地分析了多种癌症的基因组特征,揭示了癌症的分子异质性。此外,GTEx项目利用该数据集中的基因表达数据,研究了基因在不同组织中的表达模式,为理解基因功能和组织特异性提供了重要线索。这些研究不仅推动了基础生物学的发展,还为临床医学的进步提供了有力支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作