AI4Chem/C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test

Name: AI4Chem/C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test
Creator: AI4Chem
Published: 2024-04-22 06:42:25
License: 暂无描述

Hugging Face2024-04-22 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/AI4Chem/C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: mit language: - zh --- ## Introduction C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test is a High-quality single-choice full-human-writen Benchmark of 600 entries collected from Chinese Chemistry test of middle and high schools past 25 years. C-MHChem 是一个包含了600个高质量的全人工编写的单选题测评基准，收集自过去25年间中国各地初高中中高考测试题目。 ## Citation ``` @misc{zhang2024chemllm, title={ChemLLM: A Chemical Large Language Model}, author={Di Zhang and Wei Liu and Qian Tan and Jingdan Chen and Hang Yan and Yuliang Yan and Jiatong Li and Weiran Huang and Xiangyu Yue and Dongzhan Zhou and Shufei Zhang and Mao Su and Hansen Zhong and Yuqiang Li and Wanli Ouyang}, year={2024}, eprint={2402.06852}, archivePrefix={arXiv}, primaryClass={cs.AI} } ```

--- 许可证：MIT协议语言： - 中文 --- ## 简介 C-MHChem-中国初高中化学测评基准（C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test）是一套高质量全人工编制的单选题测评基准，共收录600道试题，采集自过去25年间中国各地初高中化学考试真题。 C-MHChem 是一个包含了600个高质量的全人工编写的单选题测评基准，收集自过去25年间中国各地初高中中高考测试题目。 ## 引用 @misc{zhang2024chemllm, title={ChemLLM：化学大语言模型（ChemLLM: A Chemical Large Language Model）}, author={Di Zhang and Wei Liu and Qian Tan and Jingdan Chen and Hang Yan and Yuliang Yan and Jiatong Li and Weiran Huang and Xiangyu Yue and Dongzhan Zhou and Shufei Zhang and Mao Su and Hansen Zhong and Yuqiang Li and Wanli Ouyang}, year={2024}, eprint={2402.06852}, archivePrefix={arXiv}, primaryClass={cs.AI} }

提供机构：

AI4Chem

原始信息汇总

数据集概述

名称： C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test

描述： 该数据集是一个包含600个高质量全人工编写的单选题测评基准，题目来源于中国过去25年间初高中化学测试。

语言： 中文

许可： MIT

搜集汇总

数据集介绍

构建方式

C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test数据集的构建，是通过搜集过去25年间中国各地初高中中高考测试中的化学题目，精心挑选出600个高质量的全人工编写的单选题，以此形成了这一测评基准。该数据集的构建注重题目的代表性和难度分布，旨在为化学知识评测提供可靠的标准。

特点

本数据集具有以下显著特点：一是全人工编写，确保了题目质量和准确性；二是覆盖面广，涵盖了25年的中高考化学试题，反映了化学教育的变迁和发展；三是题目难度适中，既有基础知识的考查，也有较高层次的思维应用，适用于不同水平的学习者。

使用方法

使用C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test数据集时，用户可以将其作为训练或测试化学相关模型的资源，也可以作为评估学生化学知识掌握程度的工具。数据集以MIT协议授权，用户需遵循相关协议规定，合法合规地使用数据。

背景与挑战

背景概述

在化学教育评估领域，AI4Chem/C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test数据集的构建，标志着对传统教育评价方法的一次重要突破。该数据集由600个高质量的单选题组成，全部由人工编写，汇集了我国过去25年间初高中化学考试题目，旨在为化学教育领域提供一种量化的评价标准。该数据集由张迪等研究人员于2024年提出，并在ChemLLM模型的研究中发挥了关键作用，对于推动化学教育评估的智能化、客观化具有深远影响。

当前挑战

数据集构建过程中，研究人员面临着多项挑战。首先，如何确保试题的高质量和准确性，对编写者提出了专业性与严谨性的双重要求。其次，在过去的25年中，考试题型和知识点分布可能发生变化，这对数据集的时效性和代表性提出了挑战。此外，数据集的构建还需解决如何平衡地域差异和教学差异的问题，确保数据集能够公平地反映不同地区学生的化学知识水平。

常用场景

经典使用场景

在化学教育评估领域，AI4Chem/C-MHChem-Benchmark-Chinese-Middle-high-school-Chemistry-Test数据集的典型应用场景是作为化学知识掌握程度的评估工具。该数据集包含了25年间中国初高中化学试题，为研究者提供了一个全面且历史悠久的评测标准，可用于检验化学语言模型的性能及对化学知识理解的程度。

实际应用

在实际应用中，此数据集可用于开发智能化学辅导系统，为中学生提供个性化的学习建议和反馈。同时，它也为教育部门提供了评价学生化学学习成果的一种新方法，有助于推动教育信息化和智能化进程。

衍生相关工作

基于此数据集，研究者们已经开展了一系列相关工作，如ChemLLM模型的开发，它是一个化学领域的大型语言模型，能够理解和生成化学相关文本。这些研究进一步推动了化学知识自动化处理技术的发展，为化学教育和研究提供了新的视角和工具。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集