five

SMolInstruct 化学指令微调数据集

收藏
超神经2024-03-14 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/30133
下载链接
链接失效反馈
官方服务:
资源简介:
SMolInstruct 是俄亥俄州立大学提出的一个大规模、全面且高质量的化学指令微调数据集,该数据集包含 14 个不同的化学任务,共超过 300 万个样本,涵盖 160 万个独特的分子。研究人员从多个来源收集与化学任务相关的数据,涵盖了 IUPAC 名称、 SMILES 表示、分子式等化学知识表示,以及分子属性预测、化学反应预测、分子描述等任务。

SMolInstruct is a large-scale, comprehensive and high-quality chemical instruction tuning dataset proposed by The Ohio State University. It contains 14 distinct chemical tasks with over 3 million total samples, covering 1.6 million unique molecules. Researchers collected data related to chemical tasks from multiple sources, which encompasses chemical knowledge representations such as IUPAC names, SMILES representations, molecular formulas, as well as tasks including molecular property prediction, chemical reaction prediction and molecular description.
创建时间:
2024-03-14
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SMolInstruct是一个由俄亥俄州立大学开发的大规模、高质量化学指令微调数据集,包含14个不同化学任务,覆盖超过300万个样本和160万个独特分子。该数据集整合了多种化学知识表示,如IUPAC名称和SMILES表示,并涉及分子属性预测、化学反应预测等任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务