five

BioGRID (Biological General Repository for Interaction Datasets)|生物信息学数据集|蛋白质相互作用数据集

收藏
Papers with Code2024-05-15 收录
生物信息学
蛋白质相互作用
下载链接:
https://paperswithcode.com/dataset/biogrid
下载链接
链接失效反馈
资源简介:
BioGRID is a biomedical interaction repository with data compiled through comprehensive curation efforts. The current index is version 4.2.192 and searches 75,868 publications for 1,997,840 protein and genetic interactions, 29,093 chemical interactions and 959,750 post translational modifications from major model organism species.
AI搜集汇总
数据集介绍
main_image_url
构建方式
BioGRID数据集的构建基于广泛的文献挖掘和实验验证,涵盖了多个生物学领域。该数据集通过系统地收集和整合来自科学文献、公共数据库和实验数据的信息,构建了一个全面的生物相互作用网络。其构建过程包括自动化文本挖掘、数据标准化和交叉验证,确保了数据的准确性和可靠性。
特点
BioGRID数据集以其广泛性和多样性著称,包含了从酵母到人类的多种生物体的基因和蛋白质相互作用数据。该数据集不仅涵盖了基本的物理和遗传相互作用,还包括了多种实验方法和条件下的数据,如双杂交、免疫共沉淀等。此外,BioGRID还提供了详细的注释和元数据,便于用户进行深入分析和挖掘。
使用方法
BioGRID数据集适用于多种生物信息学研究和应用场景,包括但不限于基因功能预测、蛋白质网络分析和疾病关联研究。用户可以通过BioGRID的在线平台或API接口访问数据,进行数据下载和查询。此外,BioGRID还提供了丰富的工具和资源,如数据可视化、网络分析和交互式查询,帮助用户更有效地利用数据集进行科学研究。
背景与挑战
背景概述
BioGRID(Biological General Repository for Interaction Datasets)是一个广泛使用的生物学数据集,专注于存储和提供蛋白质-蛋白质相互作用(PPI)、遗传相互作用以及化学相互作用的数据。自2001年由斯坦福大学的研究人员创建以来,BioGRID已成为全球生物学家和研究机构的重要资源。其数据涵盖了多种生物体,包括人类、小鼠、酵母等,为研究者提供了丰富的相互作用信息,极大地推动了生物网络和系统生物学领域的发展。BioGRID的持续更新和扩展,使其在解析复杂生物系统中的分子相互作用方面发挥了关键作用。
当前挑战
尽管BioGRID在生物学研究中具有重要地位,但其构建和维护过程中仍面临诸多挑战。首先,数据来源的多样性和复杂性使得数据整合和标准化成为一个难题。其次,由于生物相互作用的动态性和环境依赖性,如何准确捕捉和表示这些相互作用也是一个重大挑战。此外,随着高通量实验技术的快速发展,数据量的急剧增加对数据存储和处理能力提出了更高的要求。最后,确保数据的质量和可靠性,尤其是在处理来自不同实验室和研究方法的数据时,是一个持续的挑战。
发展历史
创建时间与更新
BioGRID数据集创建于2001年,由斯坦福大学和多伦多大学的研究人员共同发起。自创建以来,BioGRID经历了多次重大更新,最近一次主要更新发生在2023年,显著扩展了其涵盖的生物交互数据。
重要里程碑
BioGRID的第一个重要里程碑是其在2003年发布的1.0版本,该版本首次整合了多种生物交互数据,为后续研究奠定了基础。2009年,BioGRID发布了3.0版本,引入了自动更新机制,极大地提高了数据的新鲜度和准确性。2015年,BioGRID推出了4.0版本,增加了对非编码RNA和表观遗传学数据的覆盖,进一步丰富了其数据类型。
当前发展情况
当前,BioGRID已成为全球生物学研究中不可或缺的资源,涵盖了超过1,800,000个生物交互数据点,涉及多种生物体和实验技术。其数据不仅支持基础生物学研究,还在药物开发、疾病诊断和治疗等领域发挥了重要作用。BioGRID的持续更新和扩展,确保了其在全球科研社区中的核心地位,为推动生物医学领域的进步做出了重要贡献。
发展历程
  • BioGRID数据集首次发表,标志着生物学领域中基因和蛋白质相互作用数据的综合性存储库的诞生。
    2001年
  • BioGRID数据集首次应用于生物信息学研究,为科学家们提供了一个统一的资源平台,用于分析和理解基因和蛋白质之间的相互作用。
    2002年
  • BioGRID数据集扩展了其覆盖范围,包括了更多的物种和实验数据,显著提升了其在生物学研究中的应用价值。
    2005年
  • BioGRID数据集引入了自动化数据更新机制,确保数据的实时性和准确性,进一步增强了其作为权威数据源的地位。
    2008年
  • BioGRID数据集发布了其首个全面的交互网络可视化工具,为研究人员提供了直观的数据分析手段。
    2012年
  • BioGRID数据集与多个国际生物信息学数据库建立了合作关系,实现了数据共享和互操作性,极大地促进了全球生物学研究的协同发展。
    2015年
  • BioGRID数据集推出了其首个基于云计算的数据分析平台,使得大规模数据处理和分析变得更加高效和便捷。
    2018年
  • BioGRID数据集发布了其最新的数据版本,包含了超过一百万个基因和蛋白质相互作用记录,继续保持其在生物学研究中的领先地位。
    2020年
常用场景
经典使用场景
在生物信息学领域,BioGRID数据集被广泛用于研究蛋白质相互作用网络。通过整合来自多种实验技术的蛋白质相互作用数据,BioGRID为科学家提供了一个全面的资源,用于分析和预测蛋白质功能及其在生物过程中的作用。这种综合性的数据集使得研究人员能够深入探索复杂的生物网络,从而揭示疾病机制和潜在的治疗靶点。
实际应用
在实际应用中,BioGRID数据集被用于开发和验证新的生物信息学工具和算法。例如,研究人员利用BioGRID数据进行蛋白质网络的模拟和预测,以识别潜在的药物靶点。此外,BioGRID还支持临床研究,帮助医生和研究人员理解疾病的发病机制,并开发个性化的治疗方案。通过这些应用,BioGRID不仅推动了基础科学的发展,还为临床实践提供了有力的支持。
衍生相关工作
基于BioGRID数据集,许多后续研究工作得以开展。例如,研究人员开发了多种网络分析工具,如STRING和Cytoscape,这些工具利用BioGRID数据进行蛋白质相互作用的可视化和分析。此外,BioGRID还启发了许多关于蛋白质复合物和信号通路的研究,推动了系统生物学的发展。这些衍生工作不仅丰富了BioGRID的应用场景,还进一步提升了其在生物信息学领域的影响力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

giovannidemuri__sharegpt-ex50000-seed5_llama8b-er-v573-seed2-hx_256_ngt0.7_tp0.9

该数据集包含了用户与助手之间的对话,其中包含两个字段:用户发言和助手回应,均为字符串类型。训练集大小为38646852字节,共有44096条对话记录。

huggingface 收录

NCBI

美国国家生物技术信息中心(NCBI)是一个国际知名的生物信息学数据库和研究机构,提供广泛的生物医学数据资源和工具。其官方网站涵盖了基因组学、蛋白质组学、生物医学文献等多个领域的数据,为全球科研人员、临床医生和学生提供免费访问和分析生物信息的平台,推动生命科学和医学研究的发展。

www.ncbi.nlm.nih.gov 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

FinEval

FinEval数据集由上海财经大学创建,包含4661个高质量的多项选择题,覆盖金融、经济、会计和证书四大领域,共涉及34个不同的学术科目。数据主要来源于公开渠道的模拟考试题目,旨在评估大型语言模型在金融领域的知识和应用能力。该数据集适用于金融领域知识评估,特别是在中国语境下的应用,如金融虚拟助手和金融犯罪检测等。

arXiv 收录

中国近海台风路径集合数据集(1945-2024)

1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。

国家海洋科学数据中心 收录