mhc-peptides-dataset
收藏github2020-04-13 更新2024-05-31 收录
下载链接:
https://github.com/ditekunov/mhc-peptides-dataset
下载链接
链接失效反馈官方服务:
资源简介:
包含86,000个肽及其结合程度的数据集,用于预测肽是否被结合。数据集特征包括肽类型、核苷酸字母代码、结合程度的测量以及肽是否被结合的分类。
A dataset comprising 86,000 peptides along with their binding affinities, designed for predicting whether a peptide will bind. The dataset features include peptide type, nucleotide letter codes, measurements of binding affinity, and a classification indicating whether the peptide is bound.
创建时间:
2018-05-12
原始信息汇总
mhc-peptides-dataset 数据集概述
数据集基本信息
- 数据集名称:mhc-peptides-dataset
- 数据集大小:包含86,000个肽及其结合程度的数据。
数据集特征描述
| 特征 | 描述 | 类型 | 示例 |
|---|---|---|---|
| mhc | 抗原肽类型 | 字符串 | HLAA0101 |
| sequence | 核苷酸字母代码 | 字符串 | AALEGLSGF |
| meas | 结合程度的测量值 | 数值 | 0.21281259490425353 |
| pep_class | 肽是否结合 | 布尔值 | 0 |
搜集汇总
数据集介绍

构建方式
mhc-peptides-dataset的构建基于对86,000个肽段与其结合度进行采集。数据集详细记录了各类抗原肽段信息,其中*mhc*字段代表抗原肽段类型,*sequence*字段为核苷酸的字母编码,*meas*字段则是对结合度的量化测量,*pep_class*字段用于标识肽段是否具有结合能力,数据类型包括字符串、数值及布尔类型。
特点
本数据集的特点在于其规模宏大,包含丰富的肽段及其结合度信息,为MHC分子与肽段结合的分类研究提供了坚实基础。数据字段涵盖了抗原肽段的类型、序列、结合度测量值以及是否结合的分类标签,为相关领域的机器学习模型训练和生物信息学研究提供了全面的数据支持。
使用方法
使用mhc-peptides-dataset时,研究人员可以依据*mhc*和*sequence*字段进行肽段特征分析,通过*meas*字段评估结合度,并利用*pep_class*字段进行肽段结合与否的分类研究。此外,数据集的结构化设计使得其易于整合至各类数据分析框架中,便于开展深入的数据挖掘和模型构建工作。
背景与挑战
背景概述
在免疫学研究中,MHC(主要组织相容性复合体)分子与肽段的相互作用是免疫应答的关键。mhc-peptides-dataset数据集包含了86000个肽段及其与MHC分子结合程度的信息,为相关领域的研究提供了宝贵的实验数据。该数据集由ditekunov等研究人员创建于近年,旨在推动MHC-肽段结合预测算法的发展,对于深入了解免疫应答机制、疫苗设计等领域产生了深远的影响。
当前挑战
该数据集在构建和应用过程中面临的挑战主要包括:1)领域问题上的挑战,如提高MHC-肽段结合预测的准确性,这对于疾病治疗和疫苗开发至关重要;2)数据集构建中的挑战,如高质量肽段结合数据的收集与验证,以及大规模数据集的处理和存储问题。这些挑战推动了相关技术的进步,也为未来的研究工作提供了方向。
常用场景
经典使用场景
在免疫学及生物信息学领域,mhc-peptides-dataset数据集被广泛应用于研究人类主要组织相容性复合体(MHC)与肽段的结合程度。该数据集提供了86,000个肽段及其与MHC结合的测量值,是研究人员进行MHC-肽段结合预测算法开发与验证的经典资源。
解决学术问题
该数据集解决了在疫苗设计、疾病诊断及免疫调控研究中,如何准确预测MHC与肽段结合亲和力的问题。通过此数据集,学者们能够构建模型以识别哪些肽段有可能成为免疫反应的靶点,从而推动相关疾病的深入研究。
衍生相关工作
基于mhc-peptides-dataset,研究者们衍生出了众多相关工作,包括改进MHC-肽段结合预测工具,开发新的生物信息学方法来处理此类大规模数据,以及利用机器学习算法提高预测准确度。这些研究进一步拓宽了数据集的应用范围,促进了生物信息学与其他学科的交叉融合。
以上内容由遇见数据集搜集并总结生成



