Wilhelmlab/prospect-ptms-irt
收藏Hugging Face2024-06-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Wilhelmlab/prospect-ptms-irt
下载链接
链接失效反馈官方服务:
资源简介:
PROSPECT PTMs - Retention Time Prediction数据集是一个用于蛋白质组学中保留时间预测任务的质谱分析数据集。该数据集经过处理并分割,适用于开发深度学习模型。数据集包含两个配置:default和holdout。default配置包含训练、验证和测试集,基于Zenodo上的所有PROSPECT PTMs数据集;holdout配置仅包含测试集,基于Zenodo上的PROSPECT Test-PTM数据集,用于最终模型评估。数据集由Wilhelmlab - Technical University of Munich - School of Life Sciences - Germany整理,采用CC-BY4.0许可证。
PROSPECT PTMs - Retention Time Prediction数据集是一个用于蛋白质组学中保留时间预测任务的质谱分析数据集。该数据集经过处理并分割,适用于开发深度学习模型。数据集包含两个配置:default和holdout。default配置包含训练、验证和测试集,基于Zenodo上的所有PROSPECT PTMs数据集;holdout配置仅包含测试集,基于Zenodo上的PROSPECT Test-PTM数据集,用于最终模型评估。数据集由Wilhelmlab - Technical University of Munich - School of Life Sciences - Germany整理,采用CC-BY4.0许可证。
提供机构:
Wilhelmlab
原始信息汇总
数据集概述
数据集名称
- 名称: PROSPECT PTMs - Retention Time Prediction
数据集配置
- 配置名称: default, holdout
数据集特征
-
default配置特征:
- raw_file: 字符串
- scan_number: 整数
- retention_time: 浮点数
- indexed_retention_time: 浮点数
- package: 字符串
- modified_sequence: 字符串
-
holdout配置特征:
- raw_file: 字符串
- scan_number: 整数
- modified_sequence: 字符串
- retention_time: 浮点数
- indexed_retention_time: 浮点数
数据集分割
-
default配置分割:
- train: 1042693个样本, 131622696字节
- val: 299055个样本, 37745818字节
- test: 148195个样本, 18701783字节
-
holdout配置分割:
- test: 45264个样本, 5871472字节
数据集大小
- default配置下载大小: 94258505字节
- default配置数据集大小: 188070297字节
- holdout配置下载大小: 1988822字节
- holdout配置数据集大小: 5871472字节
数据集用途
- 用途: 用于保留时间预测,可选地使用额外的输入特征来编码PTMs或描述实验设置的特征。
数据集创建
- 目的: 作为保留时间预测的参考基准数据集,已处理、分割并准备好用于开发深度学习模型。
- 源数据: 基于ProteomeTools数据集,可从PRIDE获取。
- 注释: 索引保留时间是基于液相色谱测量的保留时间计算的。
- 敏感信息: 数据集不包含任何个人、敏感或私人数据。
数据集联系
- 联系邮箱: mathias.wilhelm@tum.de
- 联系单位: Wilhelmlab, TU Munich, School of Life Sciences, Germany.



