SimuBench2
收藏Hugging Face2025-08-23 更新2025-08-24 收录
下载链接:
https://huggingface.co/datasets/SimuAgent/SimuBench2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含描述、问答对、答案的JSON格式、电路图图片和Simulink的XML格式数据。数据集仅包含训练集部分,共有5010个样本,总大小约为488.68MB。
This dataset contains data in JSON format for descriptions, question-answer pairs and their corresponding answers, circuit diagram images, and Simulink-formatted XML data. The dataset only includes the training split, with a total of 5010 samples and an overall size of approximately 488.68 MB.
创建时间:
2025-08-23
原始信息汇总
SimuAgent/SimuBench2 数据集概述
数据集基本信息
- 数据集名称:SimuAgent/SimuBench2
- 下载大小:286,103,109 字节
- 数据集大小:570,665,881.9 字节
数据集结构
特征(Features)
- description:字符串类型,描述信息
- qa:字符串类型,问答数据
- model_json:字符串类型,模型JSON数据
- system_diagram:图像类型,系统图表
- simulink_xml:字符串类型,Simulink XML数据
数据划分(Splits)
-
训练集(train)
- 样本数量:3,900 个
- 数据大小:418,935,629.1 字节
-
测试集(test)
- 样本数量:1,400 个
- 数据大小:151,730,252.8 字节
配置文件
- 配置名称:default
- 数据文件路径:
- 训练集:
data/train-* - 测试集:
data/test-*
- 训练集:
搜集汇总
数据集介绍

构建方式
在工业系统建模与仿真领域,SimuBench2数据集通过系统化流程构建而成。该数据集整合了来自实际工程场景的描述文本、问答对、模型配置信息及系统示意图,并采用Simulink XML格式存储结构化数据。构建过程中严格遵循数据标准化原则,确保每个样本包含多模态信息,并通过专业验证保证数据的一致性与准确性。
使用方法
该数据集适用于工业系统建模与仿真任务的训练与评估。研究人员可加载训练集进行多模态模型训练,利用文本描述与系统图像的关联性学习仿真逻辑;测试集则用于验证模型生成系统配置或解答技术问题的能力。通过解析model_json与simulink_xml字段,可进一步实现仿真系统的自动化重构与优化分析。
背景与挑战
背景概述
随着人工智能在工程系统建模领域的深入应用,SimuBench2数据集应运而生,专注于解决复杂动态系统的多模态表示与智能问答问题。该数据集由专业研究团队构建,整合了Simulink模型的结构化数据、自然语言描述及可视化图表,旨在推动跨模态理解与自动代码生成技术的发展。其构建体现了系统工程与机器学习交叉融合的研究趋势,为工业自动化与智能设计提供了关键数据支撑。
当前挑战
SimuBench2需应对工程系统多模态对齐的核心难题,包括文本描述与模型结构的语义一致性校验、系统图谱与XML数据的跨模态关联解析。构建过程中面临大规模Simulink模型的数据标准化挑战,需协调异构数据源的兼容性,同时确保系统图谱的视觉信息与结构化数据的精确匹配,这对数据标注精度与跨领域知识整合提出了极高要求。
常用场景
经典使用场景
在控制系统工程领域,SimuBench2数据集为复杂动态系统的建模与仿真提供了标准化基准。研究者通过解析其包含的Simulink XML架构、系统框图及自然语言描述,能够系统评估各类控制算法在仿真环境中的稳定性与鲁棒性表现,尤其适用于多域物理系统的联合仿真场景。
解决学术问题
该数据集有效解决了控制系统中模型可解释性与算法泛化能力验证的学术难题。通过提供结构化的仿真组件与对应文本描述,它支持跨模态关联研究,促进了控制理论与实际工程应用的衔接,为智能控制系统的自动化设计与验证提供了关键数据支撑。
实际应用
工业自动化领域借助该数据集实现控制系统的快速原型验证。工程师可通过调用预置的仿真模型组件,构建液压、电气或机械系统的数字孪生体,显著缩短复杂控制系统开发周期,并在智能制造、航空航天等领域实现高精度动态系统仿真测试。
数据集最近研究
最新研究方向
在工业系统建模与仿真领域,SimuBench2数据集正推动基于多模态学习的智能系统设计范式转型。研究者们聚焦于融合结构化文本描述、问答对与系统图示的跨模态表征学习,旨在破解复杂工业系统语义理解与自动化生成的难题。该数据集为数字孪生、自主系统设计等前沿方向提供了关键支撑,其多模态特性尤其契合工业4.0背景下对智能建模工具的迫切需求,显著提升了系统仿真代码生成的准确性与可解释性。
以上内容由遇见数据集搜集并总结生成



