five

airr_covid19

收藏
Hugging Face2026-04-30 更新2026-05-01 收录
下载链接:
https://huggingface.co/datasets/isalgo/airr_covid19
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为covid-tcr,包含来自HLA分型的COVID-19康复者、健康人群及COVID-19疫情前捐赠者的T细胞受体(TCR)α和β链的DNA多重测序数据。数据集适用于免疫遗传学、TCR库分析以及SARS-CoV-2暴露生物标志物的推断研究。数据集遵循cc-by-nc-nd-4.0许可证,相关研究可引用Vlasova等人2026年在Genome Medicine上发表的文章。
创建时间:
2026-04-30
原始信息汇总

数据集概述:airr_covid19

  • 数据集名称:covid-tcr
  • 许可证:CC BY-NC-ND 4.0
  • 标签:airr, tcr, repertoire, immunogenetics, healthy, pre-covid, covid19, hla, dna, multiplex, sequencing
  • 数据来源:来自HLA分型的COVID-19康复者、健康供体和COVID-19前供体的DNA多重TCR α和β链测序数据
  • 应用领域:免疫遗传学、T细胞库分析、SARS-CoV-2暴露生物标志物推断
  • 相关引用:Vlasova, E.K., Nekrasova, A.I., Komkov, A.Y. 等. Inference of SARS-CoV-2 exposure biomarkers using large-scale T-cell repertoire profiling. Genome Med 18, 20 (2026).
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于HLA分型的DNA多重PCR技术,对T细胞受体α链和β链进行高通量测序,样本来源于COVID-19康复者、健康供体以及大流行前健康个体。通过系统性收集三类群体的外周血样本,结合多重扩增子测序策略,实现了对T细胞受体库的高分辨率解析,为后续分析提供标准化序列数据。
使用方法
研究者可利用该数据集进行TCR库多样性比较、公共克隆型鉴定以及SARS-CoV-2暴露相关生物标志物的推断。数据以标准AIRR格式存储,兼容主流免疫组库分析工具。建议结合HLA信息开展抗原特异性TCR预测,或通过差异丰度分析筛选与感染记忆相关的特征克隆型。
背景与挑战
背景概述
该数据集由俄罗斯研究团队于2026年构建,主要研究人员包括Vlasova、Nekrasova、Komkov等,来自机构尚未明确但属于免疫遗传学领域。其核心研究问题在于通过大规模T细胞受体(TCR)库分析推断SARS-CoV-2暴露生物标志物。数据集包含来自COVID-19恢复期、健康及疫情前捐赠者的DNA多重TCR α和β链测序数据,并关联HLA分型信息,为理解新冠病毒感染后的免疫反应提供了关键资源。该数据集在免疫组学与传染病交叉领域具有重要影响力,推动了基于TCR库的暴露检测方法发展,并为未来疫情监测和疫苗评估奠定基础。
当前挑战
该数据集解决的领域挑战包括:从高度多样化的TCR库中识别与SARS-CoV-2特异性相关的模式,区分感染暴露与其他免疫背景信号,以及克服HLA多态性对TCR结合预测的干扰。构建过程中面临的挑战有:COVID-19恢复期样本的采集时效性差异、健康与疫情前捐赠者基线定义的标准化问题,以及DNA多重测序技术中链特异性扩增偏差和引物偏好性导致的文库复杂度不足,需要精细的扩增方案优化与质量控制流程以确保数据的可重复性。
常用场景
经典使用场景
在免疫组学与传染病研究交汇的前沿,airr_covid19数据集凭借其对HLA分型COVID-19康复者、健康供体及疫情前供体的T细胞受体(TCR)α/β链DNA多重测序数据,成为探索适应性免疫应答的基石。该数据集最经典的使用场景在于通过大规模TCR库谱分析,揭示SARS-CoV-2暴露后T细胞克隆扩增的特征模式,进而推断病毒特异性免疫印记。研究者常利用其与健康及疫情前样本的对照设计,识别与病毒抗原相关的TCR序列特征,为解析抗病毒免疫的分子机制提供数据支撑。
解决学术问题
该数据集直面传染病免疫学中的核心难题:如何在无特定抗原刺激条件下,从TCR库中甄别病原体暴露的生物标志物。通过整合HLA基因型与TCR多样性数据,它解决了传统方法依赖体外刺激或已知肽段预测的局限性,推动了暴露后免疫记忆推断方法的革新。其意义在于首次在COVID-19背景下建立了大规模TCR库与感染状态之间的统计关联,为早期诊断和疫情监测提供了可量化的免疫指标,深刻影响了传染病免疫监测领域的研究范式。
实际应用
在临床转化层面,airr_covid19数据集的实际应用集中于开发基于TCR库分析的COVID-19暴露风险评估工具。例如,通过机器学习模型学习该数据集中康复者与健康对照的TCR序列差异,可设计高灵敏度的血液检测面板,用于识别无症状或既往感染个体。此外,该数据集还支持疫苗免疫效力评估,通过对比接种前后TCR库的动态变化,量化疫苗诱导的T细胞应答强度,助力个性化免疫策略的制定。
数据集最近研究
最新研究方向
当前,基于大规模T细胞受体库测序解析病毒感染免疫记忆的研究正蓬勃发展。airr_covid19数据集聚焦于HLA分型的COVID-19康复者、健康个体及疫情前对照样本的DNA多重TCR α/β链测序数据,为探索SARS-CoV-2暴露的免疫学标志物提供了珍贵资源。前沿方向在于利用深度学习和谱系聚类算法从海量TCR序列中识别病毒特异性克隆型,进而揭示感染后免疫应答的动态演变。该数据集不仅推动了针对COVID-19的T细胞免疫监测技术革新,也为未来应对未知病原体爆发时快速建立免疫档案奠定了方法论基础,具有重要的公共卫生应急意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作