five

Wilhelmlab/prospect-ptms-ms2

收藏
Hugging Face2024-06-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Wilhelmlab/prospect-ptms-ms2
下载链接
链接失效反馈
官方服务:
资源简介:
PROSPECT PTMs - Fragment Ion Intensity Prediction (MS2)数据集是一个用于蛋白质组学中机器学习应用的质量谱数据集,专门用于片段离子强度预测任务。该数据集由慕尼黑工业大学Wilhelmlab整理,采用CC-BY4.0许可证。数据集基于Zenodo上的PROSPECT PTMs数据集,并分为两个配置:default和holdout。default配置包含训练、验证和测试集,而holdout配置仅包含测试集,用于最终模型评估。数据集的结构包括多个特征,如raw_file、scan_number、modified_sequence等,并且已经过处理和分割,适用于深度学习模型的开发。

PROSPECT PTMs - Fragment Ion Intensity Prediction (MS2)数据集是一个用于蛋白质组学中机器学习应用的质量谱数据集,专门用于片段离子强度预测任务。该数据集由慕尼黑工业大学Wilhelmlab整理,采用CC-BY4.0许可证。数据集基于Zenodo上的PROSPECT PTMs数据集,并分为两个配置:default和holdout。default配置包含训练、验证和测试集,而holdout配置仅包含测试集,用于最终模型评估。数据集的结构包括多个特征,如raw_file、scan_number、modified_sequence等,并且已经过处理和分割,适用于深度学习模型的开发。
提供机构:
Wilhelmlab
原始信息汇总

数据集概述

数据集名称

  • PROSPECT PTMs - Fragment Ion Intensity Prediction (MS2)

数据集描述

  • 该数据集用于质谱学中的机器学习应用,特别是片段离子强度预测任务。数据集经过注释、处理并分割,适用于开发深度学习模型。

数据集配置

  • 默认配置 (default): 包含训练、验证和测试数据,基于所有Zenodo上的PROSPECT PTMs数据集。
  • 保留配置 (holdout): 仅包含测试数据,用于最终模型评估和比较,基于Zenodo上的PROSPECT Test-PTM数据集。

数据集特征

  • 默认配置特征:
    • raw_file: 字符串
    • scan_number: 整数
    • method_nbr: 整数
    • precursor_charge_onehot: 序列,整数
    • collision_energy_aligned_normed: 浮点数
    • intensities_raw: 序列,浮点数
    • package: 字符串
    • modified_sequence: 字符串
  • 保留配置特征:
    • raw_file: 字符串
    • scan_number: 整数
    • modified_sequence: 字符串
    • collision_energy_aligned_normed: 浮点数
    • intensities_raw: 序列,浮点数
    • precursor_charge_onehot: 序列,整数
    • method_nbr: 整数

数据集分割

  • 默认配置分割:
    • 训练集: 21294649个样本,32998969225字节
    • 验证集: 6078851个样本,9419944436字节
    • 测试集: 3003623个样本,4654383726字节
  • 保留配置分割:
    • 测试集: 783150个样本,1208775037字节

数据集大小

  • 默认配置: 下载大小3706447347字节,数据集大小47073297387字节
  • 保留配置: 下载大小50335479字节,数据集大小1208775037字节

数据集使用

  • 用于片段离子强度预测,可根据需要使用额外的特征来编码PTMs或其他实验设置特征。

数据集来源

  • 基于PROSPECT PTMs数据集,托管于Zenodo。

数据集许可证

  • CC-BY-4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作