windtunnel

Hugging Face2024-09-27 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/inductiva/windtunnel

下载链接

链接失效反馈

官方服务：

资源简介：

风洞数据集包含20,000个OpenFOAM模拟，每个模拟涉及一个独特的类似汽车的物体放置在虚拟风洞中。这些模拟在20种不同条件下进行，包括风速和旋转角度的变化。数据集分为三个子集：70%用于训练，20%用于验证，10%用于测试。数据生成过程利用Inductiva API在云上并行运行模拟。每个模拟包括几个关键文件，如输入和输出网格、压力场数据、流线和元数据。可以使用HuggingFace Datasets包下载数据集，并选择下载数据集的特定部分。

The Wind Tunnel Dataset contains 20,000 OpenFOAM simulations, each involving a unique car-like object placed in a virtual wind tunnel. These simulations are conducted under 20 distinct conditions, including variations in wind speed and rotation angles. The dataset is split into three subsets: 70% for training, 20% for validation, and 10% for testing. The data generation process leverages the Inductiva API to run simulations in parallel on the cloud. Each simulation includes several key files, such as input and output grids, pressure field data, streamlines, and metadata. The dataset can be downloaded using the HuggingFace Datasets package, with the option to select specific portions for download.

创建时间：

2024-09-26

原始信息汇总

Wind Tunnel Dataset

概述

数据集名称: Wind Tunnel dataset
数据量: 20,000个OpenFOAM模拟
对象数量: 1,000个独特的类似汽车的对象
模拟条件:
- 4种随机风速（10到50 m/s）
- 5种旋转角度（0°, 180°和3个随机角度）
模拟迭代次数: 300次
数据集划分:
- 训练集: 70%
- 验证集: 20%
- 测试集: 10%

数据生成

工具: Inductiva API
网格生成: Instant Mesh model
对象来源: Stanford Cars Dataset

数据结构

data ├── train │ ├── <SIMULATION_ID> │ │ ├── input_mesh.obj │ │ ├── openfoam_mesh.obj │ │ ├── pressure_field_mesh.vtk │ │ ├── simulation_metadata.json │ │ └── streamlines_mesh.ply │ └── ... ├── validation │ └── ... └── test └── ...

文件说明

input_mesh.obj: 输入网格的OBJ文件
openfoam_mesh.obj: OpenFOAM网格的OBJ文件
pressure_field_mesh.vtk: 压力场数据的VTK文件
streamlines_mesh.ply: 流线的PLY文件
metadata.json: 包含输入参数和输出结果（如力系数）的JSON文件

下载方式

1. 使用snapshot_download()

python from huggingface_hub import snapshot_download

dataset_name = "inductiva/windtunnel"

下载整个数据集

snapshot_download(repo_id=dataset_name, repo_type="dataset")

下载到指定本地目录

snapshot_download(repo_id=dataset_name, repo_type="dataset", local_dir="local_folder")

仅下载所有模拟的元数据

snapshot_download( repo_id=dataset_name, repo_type="dataset", local_dir="local_folder", allow_patterns=["//*/simulation_metadata.json"] )

2. 使用load_dataset()

python from datasets import load_dataset

加载数据集（支持流式加载）

dataset = load_dataset("inductiva/windtunnel", streaming=False)

显示数据集信息

print(dataset)

访问训练集中的样本

sample = dataset["train"][0] print("训练集样本:", sample)

搜集汇总

数据集介绍

构建方式

Wind Tunnel 20K 数据集的构建基于虚拟风洞环境下的计算流体动力学（CFD）模拟。首先，利用Instant Mesh模型从Stanford Cars数据集的图像中生成1000个汽车类3D网格，并通过主成分分析（PCA）进行对齐和后处理以优化网格质量。随后，使用OpenFOAM在虚拟风洞中对这些网格进行模拟，模拟条件包括4种风速（10至50 m/s）和5种旋转角度（0°、180°及3个随机角度）。整个模拟过程通过Inductiva API在云端并行执行，确保了数据的高效生成。最终，数据集被划分为训练集（70%）、验证集（20%）和测试集（10%）。

特点

Wind Tunnel 20K 数据集包含19,812次OpenFOAM模拟结果，覆盖1000个独特的汽车类对象。每个对象在20种不同条件下进行测试，生成了丰富的流场数据，包括压力场、流线等。数据集中的网格虽经过优化，但仍保留了部分缺陷，如不对称性和不规则表面，这些特征为机器学习模型提供了更具挑战性的训练数据，有助于提升模型的鲁棒性和泛化能力。此外，数据集的结构清晰，每个模拟结果均包含输入网格、OpenFOAM输出网格、压力场数据、流线数据及元数据文件，便于用户进行多维度分析。

使用方法

用户可通过Hugging Face的Datasets包下载并使用Wind Tunnel 20K数据集。数据集支持两种下载方式：使用`snapshot_download()`函数下载完整数据集或特定文件（如元数据），或通过`load_dataset()`函数加载数据集并直接访问训练集、验证集和测试集。数据集中的每个模拟结果包含多个文件，用户可通过PyVista等工具加载和分析网格数据，如输入网格、OpenFOAM输出网格、压力场数据及流线数据。此外，数据集还提供了详细的元数据文件，记录了模拟的输入参数和输出结果，便于用户进行进一步的研究和模型训练。

背景与挑战

背景概述

Wind Tunnel 20K数据集由Inductiva团队创建，旨在填补计算流体力学（CFD）与机器学习（ML）领域的数据空白。该数据集包含19,812个基于OpenFOAM的虚拟风洞模拟，涵盖了1,000个独特的汽车类物体在20米长、10米宽、8米高的风洞中的流动行为。每个物体在4种风速和5种旋转角度下进行了测试，模拟结果经过300次迭代以确保稳定性。数据集的生成依赖于Inductiva API，通过并行化的云计算实现了大规模模拟的高效执行。该数据集为CFD与ML的结合提供了重要的训练数据，推动了流体力学模拟的加速与优化研究。

当前挑战

Wind Tunnel 20K数据集在构建过程中面临多重挑战。首先，高质量3D网格的缺乏是主要瓶颈，现有数据集规模有限或网格质量不足，难以支持大规模CFD模拟。其次，尽管通过Instant Mesh模型从Stanford Cars Dataset生成了汽车类网格，但生成的网格存在表面不规则、空洞和不对称等缺陷，需通过后处理优化。此外，运行20,000次OpenFOAM模拟需要高效的并行计算资源，Inductiva API的使用虽然简化了这一过程，但仍需处理大量数据存储与计算资源的协调问题。这些挑战共同构成了数据集构建的核心难点，同时也为机器学习模型的鲁棒性和泛化能力提供了测试场景。

常用场景

经典使用场景

Wind Tunnel 20K数据集在计算流体动力学（CFD）和机器学习（ML）交叉领域的研究中具有重要应用。该数据集通过虚拟风洞实验，模拟了不同风速和角度下汽车类物体的空气动力学特性，为研究人员提供了丰富的训练数据。经典使用场景包括利用该数据集训练机器学习模型，以预测CFD模拟结果，从而显著加速传统CFD计算过程。此外，该数据集还可用于图像到3D网格生成的研究，推动计算机视觉与物理模拟的结合。

衍生相关工作

Wind Tunnel 20K数据集的发布催生了一系列相关研究工作。例如，基于该数据集的研究提出了新的机器学习模型，用于加速CFD模拟并提高预测精度。此外，该数据集还推动了图像到3D网格生成技术的发展，相关研究在计算机视觉和物理模拟领域取得了显著进展。这些工作不仅扩展了数据集的应用范围，还为CFD与ML的深度融合提供了新的研究方向。

数据集最近研究