The METLIN small molecule dataset for machine learning-based retention time prediction
收藏DataCite Commons2025-06-01 更新2024-07-27 收录
下载链接:
https://figshare.com/articles/The_METLIN_small_molecule_dataset_for_machine_learning-based_retention_time_prediction/8038913/1
下载链接
链接失效反馈官方服务:
资源简介:
<b>The METLIN Small Molecule Retention Time (SMRT) dataset</b>The METLIN SMRT is a reverse-phase retention time dataset covering a total of 80,038 small molecules. The SMRT dataset includes, for each molecule, the retention time (in seconds), the PubChem number, the molfiles containing the structure (SDF format), and molecular descriptors and extended connectivity fingerprints (ECFP) calculated with Dragon 7 (Kode Chemoinformatics, Pisa, Italy). <br>The SMRT is a freely available resource. Use and redistribution of the data, in whole or in part, requires explicit acknowledgment of the source material and the original publication:<br><br>Domingo-Almenara, X. et al. The METLIN small molecule dataset for machine learning-based retention time prediction. <i>Nature Communications </i>(2019)<i> </i>DOI: 10.1038/s41467-019-13680-7<br><br>
《METLIN小分子保留时间(SMRT)数据集》
METLIN SMRT是一款反相色谱保留时间数据集,共涵盖80038个小分子化合物。该数据集为每个小分子提供了保留时间(单位:秒)、PubChem编号、包含分子结构的SDF格式mol文件,以及由意大利比萨市Kode Chemoinformatics公司开发的Dragon 7软件计算得到的分子描述符与扩展连接性指纹(ECFP,Extended Connectivity Fingerprints)。
本数据集为免费公开资源。无论全部或部分使用、再分发该数据集,均需明确注明原始来源与发表文献:
Domingo-Almenara X 等. 用于机器学习辅助保留时间预测的METLIN小分子数据集. 《自然-通讯》(2019) DOI: 10.1038/s41467-019-13680-7
提供机构:
figshare
创建时间:
2019-12-19
搜集汇总
数据集介绍

背景与挑战
背景概述
METLIN小分子保留时间(SMRT)数据集包含80,038个小分子的保留时间、PubChem编号、分子结构文件、分子描述符和扩展连接性指纹,适用于基于机器学习的保留时间预测研究。数据集还提供了深度学习模型和结果,是一个用于代谢组学和化学信息学研究的宝贵资源。
以上内容由遇见数据集搜集并总结生成



