OpenSeeSimE-Fluid-Mini

Hugging Face2026-04-24 更新2026-04-25 收录

下载链接：

https://huggingface.co/datasets/JessicaE/OpenSeeSimE-Fluid-Mini

下载链接

链接失效反馈

官方服务：

资源简介：

OpenSeeSimE-Fluid-Mini是OpenSeeSimE-Fluid数据集的1%分层子集，旨在以较低的计算成本评估视觉语言模型，同时保持模拟类型、问题类型、媒体类型和问题ID的联合分布。数据集包含1,040个样本，分为图像和视频两种媒体类型，各占50%。数据来源包括Bent Pipe、Converging Nozzle、Heat Exchanger、Heat Sink和Mixing Pipe五种模拟模型。问题类型包括Binary、Multiple Choice和Spatial。数据集的特征包括文件名称、来源文件、问题文本、问题类型、问题ID、答案、答案选项、正确答案索引、图像、视频和媒体类型。该数据集适用于工程模拟问答的基准评估、评估管道的冒烟测试以及存储或带宽受限的比较研究。数据集采用MIT许可证，允许学术和商业使用，需注明出处。

创建时间：

2026-04-23

原始信息汇总

OpenSeeSimE-Fluid-Mini 数据集概述

基本信息

数据集地址：https://huggingface.co/datasets/JessicaE/OpenSeeSimE-Fluid-Mini
许可证：MIT（可自由用于学术和商业用途，需注明来源）
语言：英语
任务类别：视觉问答（Visual Question Answering）
数据规模：1K < n < 10K
标签：engineering, simulation, stratified-subset

数据来源与采样

父数据集：cmudrc/OpenSeeSimE-Fluid（共98,326行）
子集规模：1,040行（占父数据集的1.06%）
来源类别：Bent Pipe、Converging Nozzle、Heat Exchanger、Heat Sink、Mixing Pipe
存储格式：3个Parquet分片，约11.61 GB
采样方法：按层（strata）进行随机洗牌（种子为42），每层取ceil(n * fraction)行，非空层至少保留1行
分层依据：(source_file, question_type, media_type, question_id) 四维联合分层
嵌套关系：该1%子集是10%子集的字面子集（所有分片使用相同的洗牌前缀）

数据组成

按 source_file 分布

source_file	行数	占比 (%)
Heat Exchanger	220	21.15
Mixing Pipe	220	21.15
Bent Pipe	204	19.62
Converging Nozzle	204	19.62
Heat Sink	192	18.46

按 media_type 分布

media_type	行数
image	520
video	520

按 (source_file, question_type) 分布

source_file	Binary	Multiple Choice	Spatial	总计
Bent Pipe	82	82	40	204
Converging Nozzle	82	82	40	204
Heat Exchanger	88	88	44	220
Heat Sink	76	72	44	192
Mixing Pipe	88	88	44	220

特征模式

所有特征与父数据集一致，具体如下：

特征名	类型	说明
file_name	字符串	唯一标识符
source_file	字符串	基础仿真模型名称
question	字符串	问题文本
question_type	字符串	问题类型（Binary/Multiple Choice/Spatial）
question_id	整数	问题标识符（1-20）
answer	字符串	标准答案
answer_choices	字符串列表	选项列表
correct_choice_idx	整数	正确答案索引
image	图像	PIL图像（1920×1440），视频行为空
video	视频	视频数据，图像行为空
media_type	字符串	媒体类型（image或video）

预期用途

在降低计算开销的前提下，评估视觉语言模型在工程仿真问答任务上的表现
在运行完整基准测试前，对评估流程进行烟雾测试
适用于存储或带宽受限场景下的对比研究

引用

bibtex @article{ezemba2024opensesime, title={OpenSeeSimE: A Large-Scale Benchmark to Assess Vision-Language Model Question Answering Capabilities in Engineering Simulations}, author={Ezemba, Jessica and Pohl, Jason and Tucker, Conrad and McComb, Christopher}, year={2025} }

联系方式

Jessica Ezemba — jezemba@andrew.cmu.edu
卡内基梅隆大学机械工程系

搜集汇总

数据集介绍

构建方式

OpenSeeSimE-Fluid-Mini是基于大规模工程仿真数据集OpenSeeSimE-Fluid精心构建的层化子集，旨在以更低的计算开销保留原始数据分布的关键特性。该子集通过联合层化采样策略，依据(source_file, question_type, media_type, question_id)四维组合将数据划分为多个层级，并在每一层内使用numpy.random.default_rng(42)进行独立随机洗牌，随后取每层ceil(n * fraction)个样本，确保每一非空层至少贡献一条数据。最终从原始98,326条记录中抽取了1,040条，占比约1.06%，涵盖了弯管、收敛喷嘴、换热器、散热器和混合管五种典型仿真类型，并均衡地包含图像与视频两种媒体形式。

使用方法

该数据集专为视觉语言模型在工程仿真问答任务上的轻量级评估而设计，可直接加载至评测管道中，以极低的存储与计算开销完成模型表现的快速验证或流水线调试。使用者可通过HuggingFace Datasets库加载默认配置，获取包含文件标识、问题文本、答案选项、正确索引以及图像或视频媒体的结构化样本。研究者在进行全量基准测试前，可先在此子集上进行预测试，也可在存储或带宽受限的场景下将其用作替代性评估集合，同时需引用原始论文以标注数据来源。

背景与挑战

背景概述

在工程仿真领域，视觉-语言模型（VLM）的评估亟需高质量、多模态的基准数据集。OpenSeeSimE-Fluid-Mini由卡内基梅隆大学机械工程系的Jessica Ezemba、Jason Pohl、Conrad Tucker和Christopher McComb于2025年创建，作为OpenSeeSimE-Fluid数据集的1%分层子集，旨在以降低的计算成本评估VLM在工程流体仿真问答任务中的表现。该数据集涵盖弯曲管道、收敛喷嘴、换热器、散热器和混合管道五类工程仿真场景，包含1040个图像与视频样本，支持二元、多项选择和空间三类问题，为检验模型对工程域知识的理解与推理能力提供了标准化测试平台。其科学抽样策略确保了仿真类型、问题类型和媒体类型的联合分布得到保留，在推动VLM在工程领域的应用方面具有重要影响力。

当前挑战

OpenSeeSimE-Fluid-Mini所解决的领域挑战在于，工程仿真问答不同于自然图像问答，需要模型同时理解流体动力学原理、几何结构的三维空间关系以及动态过程，这对VLM的视觉感知与物理推理能力提出了严峻考验。在构建过程中，挑战主要体现为：1）数据生成需从复杂仿真模型中精准提取地面真值，确保答案的物理正确性；2）大规模数据（原数据集98326行）的存储与处理效率低下，子集的抽样必须在不破坏关键分布特征的前提下实现显著规模缩减；3）多模态数据（图像与视频）的格式统一与标注一致性维护要求严密。该数据集的策略性分层抽样方案，为缓解这些挑战提供了可行路径。

常用场景

经典使用场景

在工程仿真与计算机视觉交叉领域，OpenSeeSimE-Fluid-Mini数据集被广泛用于评估视觉-语言模型在工程模拟问答任务上的表现。该数据集通过分层抽样策略，从完整数据集中保留了仿真类型、问题类型、媒体类型和问题标识的联合分布，使得研究者在降低计算开销的同时，仍能获得具有代表性的评估结果。其经典使用场景包括对模型在管道弯曲、收敛喷嘴、换热器、散热器和混合管道等五种工程构型下的视觉理解与推理能力进行基准测试，涵盖二元分类、多项选择和空间定位三类问题，并以图像和视频两种媒体形式呈现，全面考察模型对流体动力学仿真视觉信息的处理能力。

解决学术问题

该数据集有效解决了工程领域视觉-语言模型评估中缺乏标准化、可复现基准的关键学术难题。在OpenSeeSimE-Fluid-Mini出现之前，研究者难以系统衡量模型对工程仿真图像和视频的理解深度，尤其是在涉及空间关系与物理规律的问答任务中。该数据集通过精心设计的问题类型和结构化标注，为模型在工程模拟领域的视觉推理能力提供了量化评价框架，推动了多模态学习在工程应用中的方法论创新。其意义在于降低了大规模基准测试的计算资源门槛，使得更多研究团队能够开展有意义的对比实验，从而加速了面向工程领域的专用视觉-语言模型的发展。

实际应用

在实际工程应用中，OpenSeeSimE-Fluid-Mini数据集为自动化工程仿真分析与智能辅助设计工具的开发提供了关键支撑。基于该数据集训练的视觉-语言模型能够自动识别仿真结果中的物理流动特征，例如判别管道内流体是否发生分离、判断喷嘴出口速度分布是否均匀，或定位换热器中的高温区域。这些能力可被集成到计算机辅助工程软件中，帮助工程师快速解读仿真结果、生成分析报告，或为设计优化提供智能建议。此外，该数据集支持图像与视频两种媒体形式，使其适用于连续动态过程的实时监测场景，例如在工业生产线中通过视频流检测流体异常行为。

数据集最近研究