Mol-Instructions
收藏arXiv2024-03-04 更新2024-06-21 收录
下载链接:
https://github.com/zjunlp/Mol-Instructions
下载链接
链接失效反馈资源简介:
Mol-Instructions是由浙江大学计算机科学与技术学院创建的一个大规模生物分子指令数据集,旨在通过分子导向指令、蛋白质导向指令和生物分子文本指令三个核心组件,提高大型语言模型在生物分子领域的性能。数据集包含2,043,587条指令,涵盖了分子属性预测、蛋白质功能预测和生物分子文本理解等多个任务。创建过程中,数据从多个授权来源收集,并通过转换为适合特定任务的指令格式进行处理。该数据集的应用领域包括加速药物开发、揭示新的生物分子研究领域,并提升大型模型对生物学的理解能力。
提供机构:
浙江大学计算机科学与技术学院
创建时间:
2023-06-13



