AsEP
收藏AsEP Dataset 概述
数据集简介
AsEP(Antibody-specific Epitope Prediction)数据集用于抗体特异性表位预测。该数据集用于论文《AsEP: Benchmarking Deep Learning Methods for Antibody-specific Epitope Prediction》,提交至 NeurIPS 2024 数据集和基准测试。
数据集下载
原始数据集可从 Zenodo 下载。此外,还提供了命令行脚本下载数据集: shell download-asep /path/to/directory AsEP
数据集接口
数据集提供了 Python 接口 asep,包含以下功能:
- 数据集接口
- 加载预构建的抗体-抗原复合物图
- 构建神经网络模型,使用蛋白质语言模型(PLM)进行节点嵌入和图神经网络(GNN)进行图表示
- 训练和评估脚本
安装
支持通过 devcontainer 和 conda 环境进行安装。
数据加载
抗体-抗原复合物以二维图对形式提供,包含两种节点特征:
- 独热编码
- 使用 AntiBERTy 和 ESM2 预计算的嵌入
示例代码: python from asep.data.asepv1_dataset import AsEPv1Dataset
asepv1_dataset = AsEPv1Dataset(root=./data, name=asep, feat_type=one_hot) graph_pair = asepv1_dataset[0] node_labels_b = graph_pair.y_b node_labels_g = graph_pair.y_g edge_index_bg = graph_pair.edge_index_bg
数据分割
支持两种分割方法:epitope_ratio 和 epitope_group。
示例代码: python split_idx = asepv1_dataset.get_idx_split(split_method="epitope_ratio") train_set = asepv1_dataset[split_idx[train]] valid_set = asepv1_dataset[split_idx[valid]] test_set = asepv1_dataset[split_idx[test]]
评估
提供评估器用于评估模型性能: python from asep.data.asepv1_dataset import AsEPv1Evaluator
evaluator = AsEPv1Evaluator() result_dict = evaluator.eval({y_pred: y_pred, y_true: y_true})
基准性能
在 epitope ratio 和 epitope group 两种设置下,多个深度学习模型的性能如下:
Epitope Ratio
| Algorithm | MCC | Precision | Recall | AUCROC | F1 |
|---|---|---|---|---|---|
| WALLE | 0.210 (0.020) | 0.235 (0.018) | 0.422 (0.028) | 0.635 (0.013) | 0.258 (0.018) |
| EpiPred | 0.029 (0.018) | 0.122 (0.014) | 0.180 (0.019) | — | 0.142 (0.016) |
| ESMFold | 0.028 (0.010) | 0.137 (0.019) | 0.043 (0.006) | 0.060 (0.008) | — |
| ESMBind | 0.016 (0.008) | 0.106 (0.012) | 0.121 (0.014) | 0.506 (0.004) | 0.090 (0.009) |
| MaSIF-site | 0.037 (0.012) | 0.125 (0.015) | 0.183 (0.017) | — | 0.114 (0.011) |
Epitope Group
| Algorithm | MCC | Precision | Recall | AUCROC | F1 |
|---|---|---|---|---|---|
| WALLE | 0.077 (0.015) | 0.143 (0.017) | 0.266 (0.025) | 0.544 (0.010) | 0.145 (0.014) |
| EpiPred | -0.006 (0.015) | 0.089 (0.011) | 0.158 (0.019) | — | 0.112 (0.014) |
| ESMFold | 0.018 (0.010) | 0.113 (0.019) | 0.034 (0.007) | — | 0.046 (0.009) |
| ESMBind | 0.002 (0.008) | 0.082 (0.011) | 0.076 (0.011) | 0.500 (0.004) | 0.064 (0.008) |
| MaSIF-site | 0.046 (0.014) | 0.164 (0.020) | 0.174 (0.015) | — | 0.128 (0.012) |

- 1AsEP: Benchmarking Deep Learning Methods for Antibody-specific Epitope Prediction伦敦大学学院结构分子生物学系 · 2024年



