ChemBench4K
收藏OpenDataLab2026-05-17 更新2024-05-18 收录
下载链接:
https://opendatalab.org.cn/OpenScienceLab/ChemBench
下载链接
链接失效反馈官方服务:
资源简介:
chembench是一个包含了九项化学核心任务,4100个高质量单选问答的大语言模型化学能力评测基准.
提供机构:
OpenScienceLab
创建时间:
2024-05-14
搜集汇总
数据集介绍

背景与挑战
背景概述
ChemBench4K是一个用于化学大语言模型评测的数据集,涵盖九项核心化学任务,包含4100个高质量的单选问答。它旨在评估模型在化学领域的综合能力,由上海人工智能实验室于2024年发布。
以上内容由遇见数据集搜集并总结生成



