five

keiwoo/TCRdb2

收藏
Hugging Face2025-10-17 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/keiwoo/TCRdb2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从TCRdb2.0收集的T细胞受体序列数据集,经过去重处理后包含约290,315,598条非重复序列,另有一个经过cd-hit筛选后保留约1,782,927条高相似度序列的版本。数据集适用于特征提取任务,数据量在100M到1B之间。

This dataset is a collection of T cell receptor sequences from TCRdb2.0, containing approximately 290,315,598 non-redundant sequences after deduplication, and another version with about 1,782,927 sequences remaining after cd-hit filtering for high similarity. It is suitable for feature extraction tasks and the dataset size is between 100M and 1B.
提供机构:
keiwoo
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作