five

SAbDab_raw

收藏
Hugging Face2026-03-05 更新2026-03-06 收录
下载链接:
https://huggingface.co/datasets/ProteinMPNN/SAbDab_raw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含截至2026年3月4日从结构抗体数据库(SAbDab)获取的所有可用数据。SAbDab是一个抗体结构数据库,涵盖实验细节、抗体命名法、亲和力数据和序列注释。数据集规模在10,000到100,000条记录之间,包含丰富的特征字段,如PDB ID、重链和轻链信息、抗原详情、实验方法、分辨率、亲和力数据等。适用于抗体-抗原相互作用筛选、抗体结构特征查询等任务。数据集采用CC-BY 4.0许可,由SAbDab团队、RosettaCommons及多个学术机构共同贡献。相关研究发表于《Nucleic Acids Research》(2014年,卷42,期D1,页D1140-D1146)。
创建时间:
2026-03-04
原始信息汇总

数据集概述:SAbDab_raw

数据集基本信息

  • 数据集名称:Raw data from The Structural Antibody Database (SAbDab)
  • 数据集标识:ProteinMPNN/SAbDab_raw
  • 语言:英语
  • 许可协议:CC-BY 4.0
  • 标签:生物学、化学

数据集内容摘要

  • 数据来源:该数据集包含截至2026年3月4日结构抗体数据库(SAbDab)中所有可用的数据。
  • 数据库描述:SAbDab是一个抗体结构数据库,包含实验细节、抗体命名法、亲和力数据和序列注释。

数据集规模

  • 规模类别:10K < n < 100K(具体行数:20701)

数据集结构

数据集加载后为列导向格式,包含以下特征列:

  • pdb
  • Hchain
  • Lchain
  • model
  • antigen_chain
  • antigen_type
  • antigen_het_name
  • antigen_name
  • short_header
  • date
  • compound
  • organism
  • heavy_species
  • light_species
  • antigen_species
  • authors
  • resolution
  • method
  • r_free
  • r_factor
  • scfv
  • engineered
  • heavy_subclass
  • light_subclass
  • light_ctype
  • affinity
  • delta_g
  • affinity_method
  • temperature
  • pmid

主要用途

  • 筛选抗体-抗原相互作用
  • 查询抗体的结构特征

致谢

感谢SAbDab团队、RosettaCommons以及以下机构:加州大学洛杉矶分校、马里兰大学、俄勒冈大学、密歇根大学、宾夕法尼亚大学和威斯塔研究所。

引用信息

  • BibTeX

    @article{10.1093/nar/gkt1043, author = {Dunbar, James and Krawczyk, Konrad and Leem, Jinwoo and Baker, Terry and Fuchs, Angelika and Georges, Guy and Shi, Jiye Deane, Charlotte M.}, title = {SAbDab: the structural antibody database}, journal = {Nucleic Acids Research}, volume = {42}, number = {D1}, pages = {D1140-D1146}, year = {2013}, month = {11}, abstract = {Structural antibody database (SAbDab; http://opig.stats.ox.ac.uk/webapps/sabdab) is an online resource containing all the publicly available antibody structures annotated and presented in a consistent fashion. The data are annotated with several properties including experimental information, gene details, correct heavy and light chain pairings, antigen details and, where available, antibody–antigen binding affinity. The user can select structures, according to these attributes as well as structural properties such as complementarity determining region loop conformation and variable domain orientation. Individual structures, datasets and the complete database can be downloaded.}, issn = {0305-1048}, doi = {10.1093/nar/gkt1043}, url = {https://doi.org/10.1093/nar/gkt1043}, eprint = {https://academic.oup.com/nar/article-pdf/42/D1/D1140/3538157/gkt1043.pdf}}

  • APA格式: James Dunbar, Konrad Krawczyk, Jinwoo Leem, Terry Baker, Angelika Fuchs, Guy Georges, Jiye Shi, Charlotte M. Deane, SAbDab: the structural antibody database, Nucleic Acids Research, Volume 42, Issue D1, 1 January 2014, Pages D1140–D1146, https://doi.org/10.1093/nar/gkt1043

数据集卡片作者

Miranda Simpson (miranda13nicoles@gmail.com), Becca Lee (beccalee5@g.ucla.edu), Nathaniel Felbinger (nfelbing@umd.edu), Pratyush Dhal (pdhal@umich.edu), Colby Agostino (colby.agostino@pennmedicine.upenn.edu)

搜集汇总
数据集介绍
构建方式
在结构生物学领域,抗体数据库的构建对于理解免疫识别机制至关重要。SAbDab_raw数据集通过系统整合公开可用的抗体结构数据,采用标准化注释流程,涵盖了截至2026年3月4日的所有抗体结构信息。其构建过程依赖于从蛋白质数据库(PDB)中提取抗体-抗原复合物结构,并辅以实验细节、抗体命名、亲和力数据及序列注释等多维度元数据的统一标注,确保了数据的全面性与一致性。
特点
该数据集以其丰富的结构注释和广泛的覆盖范围而著称,包含了超过两万条抗体结构记录,每条记录均详细标注了重链与轻链配对、抗原类型、实验方法及亲和力参数等关键属性。其独特之处在于提供了标准化的结构特征描述,如互补决定区构象和可变域取向,为抗体工程与设计研究奠定了坚实基础。数据以列导向格式存储,支持灵活的数据访问与转换,便于进行大规模结构分析与机器学习建模。
使用方法
在计算免疫学研究中,该数据集可通过HuggingFace Datasets库便捷加载,用户只需指定数据集路径与子集名称即可获取结构化数据。加载后的数据以Arrow格式呈现,可直接访问特定列或转换为Pandas DataFrame及Parquet格式,适用于抗体-抗原相互作用筛选、结构特征查询等任务。其开放许可与标准化接口设计,为生物信息学与药物发现领域的算法开发提供了可靠的数据支撑。
背景与挑战
背景概述
抗体结构数据库SAbDab由牛津大学等研究机构于2013年创建,旨在系统整合公开可用的抗体三维结构数据。该数据库由James Dunbar、Konrad Krawczyk及Charlotte M. Deane等学者主导开发,核心研究问题聚焦于抗体-抗原相互作用的分子机制解析,通过标准化注释体系统一收录实验细节、亲和力数据及序列特征。作为结构免疫学领域的重要基础设施,SAbDab为抗体工程、药物设计及免疫识别研究提供了关键的结构生物学依据,持续推动计算抗体设计方法的创新与发展。
当前挑战
在抗体结构研究领域,准确预测抗体-抗原结合界面与亲和力始终是核心挑战,涉及高变区构象动态性与结合自由能计算的复杂性。SAbDab构建过程中需克服多源结构数据标准化整合的难题,包括纠正重链与轻链配对错误、统一不同实验方法产生的异构注释,并持续维护结构数据与生物活性数据的关联一致性。此外,随着冷冻电镜等新技术产生海量结构数据,如何实现实时更新与跨平台数据互操作也成为数据库可持续发展的关键瓶颈。
常用场景
经典使用场景
在抗体工程与免疫学领域,SAbDab_raw数据集为研究人员提供了全面的抗体结构信息,其经典使用场景集中于抗体-抗原相互作用的系统性筛选与分析。通过整合实验细节、抗体命名、亲和力数据及序列注释,该数据集支持对互补决定区构象、可变域取向等结构属性的深入查询,为抗体设计、优化及功能预测奠定了坚实基础。
实际应用
在实际应用中,SAbDab_raw数据集被广泛用于抗体药物的理性设计与开发。制药企业与研究机构利用其结构数据筛选高亲和力抗体候选物,优化治疗性抗体的稳定性和特异性。此外,该数据集支持疫苗研发中的抗原表位映射,以及诊断试剂中抗体探针的设计,加速了生物医学产品的转化进程。
衍生相关工作
基于SAbDab_raw数据集,衍生出多项经典研究工作,例如抗体结构预测模型如DeepAb和RosettaAntibody的开发,这些工具利用数据集中的结构信息训练机器学习算法。同时,该数据集为抗体人源化、亲和力成熟等计算方法的验证提供了基准,促进了抗体工程领域开源软件与数据库的生态建设。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作