Wilhelmlab/prospect-ptms-ms2
收藏Hugging Face2024-06-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Wilhelmlab/prospect-ptms-ms2
下载链接
链接失效反馈官方服务:
资源简介:
PROSPECT PTMs - Fragment Ion Intensity Prediction (MS2)数据集是一个用于蛋白质组学中机器学习应用的质量谱数据集,专门用于片段离子强度预测任务。该数据集由慕尼黑工业大学Wilhelmlab整理,采用CC-BY4.0许可证。数据集基于Zenodo上的PROSPECT PTMs数据集,并分为两个配置:default和holdout。default配置包含训练、验证和测试集,而holdout配置仅包含测试集,用于最终模型评估。数据集的结构包括多个特征,如raw_file、scan_number、modified_sequence等,并且已经过处理和分割,适用于深度学习模型的开发。
PROSPECT PTMs - Fragment Ion Intensity Prediction (MS2)数据集是一个用于蛋白质组学中机器学习应用的质量谱数据集,专门用于片段离子强度预测任务。该数据集由慕尼黑工业大学Wilhelmlab整理,采用CC-BY4.0许可证。数据集基于Zenodo上的PROSPECT PTMs数据集,并分为两个配置:default和holdout。default配置包含训练、验证和测试集,而holdout配置仅包含测试集,用于最终模型评估。数据集的结构包括多个特征,如raw_file、scan_number、modified_sequence等,并且已经过处理和分割,适用于深度学习模型的开发。
提供机构:
Wilhelmlab
原始信息汇总
数据集概述
数据集名称
- PROSPECT PTMs - Fragment Ion Intensity Prediction (MS2)
数据集描述
- 该数据集用于质谱学中的机器学习应用,特别是片段离子强度预测任务。数据集经过注释、处理并分割,适用于开发深度学习模型。
数据集配置
- 默认配置 (default): 包含训练、验证和测试数据,基于所有Zenodo上的PROSPECT PTMs数据集。
- 保留配置 (holdout): 仅包含测试数据,用于最终模型评估和比较,基于Zenodo上的PROSPECT Test-PTM数据集。
数据集特征
- 默认配置特征:
- raw_file: 字符串
- scan_number: 整数
- method_nbr: 整数
- precursor_charge_onehot: 序列,整数
- collision_energy_aligned_normed: 浮点数
- intensities_raw: 序列,浮点数
- package: 字符串
- modified_sequence: 字符串
- 保留配置特征:
- raw_file: 字符串
- scan_number: 整数
- modified_sequence: 字符串
- collision_energy_aligned_normed: 浮点数
- intensities_raw: 序列,浮点数
- precursor_charge_onehot: 序列,整数
- method_nbr: 整数
数据集分割
- 默认配置分割:
- 训练集: 21294649个样本,32998969225字节
- 验证集: 6078851个样本,9419944436字节
- 测试集: 3003623个样本,4654383726字节
- 保留配置分割:
- 测试集: 783150个样本,1208775037字节
数据集大小
- 默认配置: 下载大小3706447347字节,数据集大小47073297387字节
- 保留配置: 下载大小50335479字节,数据集大小1208775037字节
数据集使用
- 用于片段离子强度预测,可根据需要使用额外的特征来编码PTMs或其他实验设置特征。
数据集来源
- 基于PROSPECT PTMs数据集,托管于Zenodo。
数据集许可证
- CC-BY-4.0



