five

CAS-SIAT-XinHai/mllmChem10K

收藏
Hugging Face2025-03-31 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/CAS-SIAT-XinHai/mllmChem10K
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了化学相关的消息和图像数据。消息数据包括角色和内容两个字段,角色为字符串类型,内容也为字符串类型。图像数据则未详细描述其字段。数据集分为训练集和多个测试集,测试集分别针对不同的化学任务,如反应预测、分子描述生成、OCR识别、属性预测、反应物预测和逆合成反应预测等。每个数据集的大小和示例数量都有所不同。

The dataset consists of chemistry-related messages and images. The message data includes two fields: role and content, both of which are of string type. The image data does not have detailed field descriptions. The dataset is divided into a training set and multiple test sets, each focusing on different chemical tasks such as reaction prediction, molecular description generation, OCR recognition, property prediction, reagent prediction, and retrosynthesis prediction. Each dataset has different sizes and numbers of examples.
提供机构:
CAS-SIAT-XinHai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作