Surface Plasmon Resonance (SPR) Data
收藏github2024-12-15 更新2024-12-20 收录
下载链接:
https://github.com/AbSciBio/igdesign
下载链接
链接失效反馈官方服务:
资源简介:
包含通过验证IgDesign生成的SPR数据,位于./data目录中,代表性传感器图在./data/Sensorgrams中。每个CSV对应一个抗体-抗原系统。数据集的列包括:Target(筛选目标)、Reference Ab(使用的参考抗体)、Method(序列生成方法)、HCDRs Designed(设计的HCDRs)、HCDR1(HCDR1序列)、HCDR2(HCDR2序列)、HCDR3(HCDR3序列)、KD (nM)(SPR测量的结合亲和力,重复平均值)、Binding Replicates(观察到的结合重复次数)、Replicates(观察到的重复次数)、Ratio Binding Replicates(显示结合的重复比例)、Binder(对于结合剂为True,对于非结合剂为False)。
This dataset contains SPR (Surface Plasmon Resonance) data generated using validated IgDesign, stored in the ./data directory. Representative sensorgrams are located in the ./data/Sensorgrams directory. Each CSV file corresponds to one antibody-antigen system. The columns of the dataset include: Target (screening target), Reference Ab (reference antibody used), Method (sequence generation method), HCDRs Designed (designed HCDRs), HCDR1 (HCDR1 sequence), HCDR2 (HCDR2 sequence), HCDR3 (HCDR3 sequence), KD (nM) (binding affinity measured via SPR, average value of replicate measurements), Binding Replicates (number of observed binding replicates), Replicates (total number of observed replicates), Ratio Binding Replicates (proportion of replicates showing binding), Binder (True for binders and False for non-binders).
创建时间:
2024-12-14
原始信息汇总
IgDesign 数据集概述
数据集内容
- 模型权重:包含预训练的模型权重,特别是LMDesign和fine-tuned ProteinMPNN的权重,这些权重与排除ACVR2B目标的分割相关。
- 推理数据:提供用于反向折叠序列的推理脚本
predict.py,支持使用不同的配置文件进行推理。 - 配置文件:包含用于推理的YAML配置文件,详细定义了推理过程中的参数。
- SPR数据:包含通过验证IgDesign生成的表面等离子体共振(SPR)数据,位于
./data目录下,传感器图谱位于./data/Sensorgrams。
数据集结构
- 模型权重:通过脚本
download_ckpts.sh下载。 - 推理脚本:
predict.py用于生成序列和交叉熵损失。 - 配置文件:位于
./configs目录下,定义了推理的详细参数。 - SPR数据:包含多个CSV文件,每个文件对应一个抗体-抗原系统,列出了目标、参考抗体、生成方法、设计的HCDRs、序列、结合亲和力等信息。
数据集字段
- SPR数据字段:
Target:筛选的目标Reference Ab:使用的参考抗体Method:序列生成方法HCDRs Designed:设计的HCDRsHCDR1:HCDR1序列HCDR2:HCDR2序列HCDR3:HCDR3序列KD (nM):结合亲和力(SPR测量的平均值)Binding Replicates:观察到的结合重复次数Replicates:观察到的重复次数Ratio Binding Replicates:显示结合的重复比例Binder:是否为结合剂scRMSD columns:按区域组织的scRMSD列
数据集使用
- 安装:通过
micromamba创建环境并激活,然后安装igdesign包。 - 推理:使用
predict.py进行序列生成,支持不同的配置文件。 - 数据下载:通过脚本下载模型权重和SPR数据。
引用
- 如果使用该数据集,请引用相关论文。
搜集汇总
数据集介绍

构建方式
在构建表面等离子体共振(SPR)数据集时,研究团队通过验证IgDesign模型生成的抗体序列,利用SPR技术测量了抗体与抗原之间的结合亲和力。数据集包含了多个抗体-抗原系统的实验结果,每个CSV文件对应一个系统,记录了抗体序列、结合亲和力(KD值)、以及结合复制的详细信息。此外,数据集还包含了不同设计方法(如正控制、SAbDab和逆折叠)生成的抗体序列及其对应的结合性能。
特点
该数据集的显著特点在于其包含了多种抗体设计方法的对比结果,特别是正控制、SAbDab和逆折叠方法的序列生成与结合性能。此外,数据集详细记录了每个抗体-抗原系统的结合亲和力(KD值)、结合复制的数量及其比例,以及是否为结合体的分类信息。这些数据为研究抗体设计与优化提供了丰富的实验依据。
使用方法
使用该数据集时,用户可以通过加载CSV文件来访问每个抗体-抗原系统的详细信息,包括抗体序列、结合亲和力、以及不同设计方法的性能对比。用户可以利用这些数据进行抗体设计的进一步分析与优化,例如通过比较不同设计方法的结合性能,评估其有效性。此外,数据集还提供了配置文件,用户可以根据需要调整参数以进行自定义的抗体设计与分析。
背景与挑战
背景概述
表面等离子体共振(Surface Plasmon Resonance, SPR)数据集是由Shanehsazzadeh等人于2023年创建的,旨在通过验证IgDesign模型来评估抗体设计的效果。该数据集的核心研究问题是如何利用逆折叠技术生成有效的抗体序列,并通过SPR实验测量其与抗原的结合亲和力。IgDesign模型通过结合语言模型和蛋白质结构预测模型,生成了多种抗体序列,并通过SPR实验验证了这些序列的生物学功能。该数据集的发布不仅为抗体设计领域提供了宝贵的实验数据,还为未来的抗体工程研究奠定了基础。
当前挑战
该数据集在构建过程中面临了多个挑战。首先,抗体序列的生成依赖于复杂的逆折叠技术,如何确保生成的序列具有高度的生物学合理性和功能性是一个重要挑战。其次,SPR实验的测量精度直接影响数据集的质量,如何确保实验结果的可靠性和一致性也是一个关键问题。此外,数据集中包含的抗体-抗原系统多样性较大,如何有效地处理和分析这些多样化的数据也是一个挑战。最后,数据集的发布涉及敏感的生物信息,如何确保数据的安全性和隐私性也是一个不容忽视的问题。
常用场景
经典使用场景
表面等离子体共振(SPR)数据集在抗体设计领域中具有经典应用场景,主要用于评估抗体与抗原之间的结合亲和力。通过分析SPR数据,研究人员能够量化抗体与目标抗原的相互作用,进而优化抗体设计策略。该数据集提供了详细的传感器图谱和结合亲和力数据,为抗体设计的精确调控提供了科学依据。
解决学术问题
SPR数据集解决了抗体设计中的关键学术问题,特别是在抗体与抗原结合亲和力的定量分析方面。通过提供精确的结合亲和力数据,该数据集帮助研究人员理解抗体与抗原之间的相互作用机制,从而推动了抗体工程和药物设计的研究进展。此外,SPR数据集还为验证新型抗体设计算法提供了实验依据,增强了算法的可靠性和实用性。
衍生相关工作
基于SPR数据集,研究人员开发了多种抗体设计算法和模型,如IgDesign和ProteinMPNN等。这些算法利用SPR数据进行模型训练和验证,显著提高了抗体设计的效率和准确性。此外,SPR数据集还激发了对抗体与抗原相互作用机制的深入研究,推动了相关领域的理论发展和技术创新。
以上内容由遇见数据集搜集并总结生成



