constellaration

Hugging Face2025-05-12 更新2025-05-13 收录

下载链接：

https://huggingface.co/datasets/proxima-fusion/constellaration

下载链接

链接失效反馈

官方服务：

资源简介：

ConStellaration 是一个包含多种准等离体 (QI) 螺旋边界形状、相应的性能指标和理想磁流体动力学 (MHD) 平衡状态的数据库，以及生成这些形状的设置。该数据集旨在降低优化和机器学习研究人员为螺旋设计做出贡献的门槛，并加速跨学科进步，以便将融合能源引入电网。

创建时间：

2025-05-09

原始信息汇总

数据集概述：ConStellaration

数据集详情

数据集名称：ConStellaration
创建者：Proxima Fusion
许可证：MIT
语言：英语
标签：物理学、聚变、优化、NeurIPS
数据集大小分类：10K<n<100K

数据集描述

ConStellaration数据集包含多样化的准等动力（QI）恒星器边界形状及其对应的性能指标和理想磁流体动力学（MHD）平衡，以及生成这些数据的设置。该数据集旨在降低优化和机器学习研究人员参与恒星器设计的门槛，并加速跨学科进展，以实现聚变能源的商业化。

数据集结构

数据集包含三个配置：

full_flat
- 特征：包含等离子体边界、理想MHD指标、全向场和目标、各种方法的采样设置（DESC、VMEC、QP初始化、近轴扩展）以及采样或指标计算过程中可能出现的错误信息。
- 数据类型：扁平化的JSON结构，每个叶子节点为一个单独的列。
- 样本数量：182,222
- 大小：431,253,433字节
- 下载大小：239,021,787字节
full_json
- 特征：与full_flat相同，但数据以JSON格式存储。
- 样本数量：182,222
- 大小：798,346,097字节
- 下载大小：385,377,661字节
vmecpp_ideal_mhd_equilibria
- 特征：包含等离子体边界对应的VMEC输出文件的JSON表示。
- 样本数量：324
- 大小：1,373,486,837字节
- 下载大小：956,063,943字节

数据字段

full_flat 和 full_json 配置

边界信息：包括场周期数、恒星器对称性、边界表面参数等。
性能指标：包括QI值、真空井、纵横比、最大伸长率等。
全向场和目标：包括纵横比、主半径、最大伸长率、旋转变换等。
优化设置：包括目标设置、优化器设置、平衡设置等。
错误信息：记录在采样或指标计算过程中可能出现的错误。

vmecpp_ideal_mhd_equilibria 配置

等离子体配置ID：唯一标识符。
VMEC输出文件ID：唯一标识符。
VMEC输出文件JSON：VMEC输出文件的JSON表示。

使用示例

python import datasets import torch from torch.utils.data import DataLoader

ds = datasets.load_dataset("proxima-fusion/constellaration", "full_flat")["train"] ds = ds.select_columns([c for c in ds.column_names if c.startswith("boundary.") or c.startswith("metrics.")])

device = torch.device("cuda" if torch.cuda.is_available() else "cpu") ds_torch = ds.with_format("torch", device=device) # other options: "jax", "tensorflow" etc.

dataloader = DataLoader(ds_torch, batch_size=4)

for batch in dataloader: print(batch) break

来源

仓库：https://huggingface.co/datasets/proxima-fusion/constellaration
代码：https://github.com/proximafusion/constellaration

搜集汇总

数据集介绍

构建方式

在磁约束聚变研究领域，ConStellaration数据集通过多模态方法构建而成，整合了182,222个准等动力（QI）仿星器边界形态的数值模拟结果。数据集采用DESC和VMEC等磁流体动力学代码进行边界优化，记录包括傅里叶谐波系数、磁镜比等214维物理特征，并通过自动化流程将WOut文件转化为结构化JSON格式。构建过程中采用五重交叉验证确保数据完整性，同时保留原始计算误差标记以增强研究透明度。

特点

该数据集最显著的特点是涵盖多维磁约束位形空间，包含边界谐波展开系数（r_cos/z_sin）、21项关键等离子体性能指标（如安全因子、环径比）以及优化过程元数据。数据以全展开（full_flat）和JSON嵌套（full_json）双格式存储，支持从原始模拟参数到理想MHD平衡态的端到端分析。特别值得注意的是，数据集捕获了非对称位形和不同场周期数的物理特性，为研究仿星器拓扑多样性提供了独特资源。

使用方法

研究人员可通过HuggingFace数据集库直接加载数据，支持PyTorch/TensorFlow等框架的GPU加速处理。典型工作流包括：使用plasma_config_id关联边界参数与平衡态数据，基于metrics子集筛选特定性能的位形，或利用omnigenous_field字段重建优化目标。对于机器学习应用，建议从full_flat配置中提取边界谐波系数作为输入特征，结合metrics.qi等参数构建回归模型。高级用法可结合VMEC++的JSON输出进行磁面拓扑分析。

背景与挑战

背景概述

ConStellaration数据集由Proxima Fusion团队创建，专注于准等动力（QI）恒星器的边界形状及其性能指标的收集与分析。恒星器作为磁约束装置，在实现稳态无碳聚变能源领域具有重要研究价值。该数据集通过整合多样化的等离子体边界形状、理想磁流体动力学（MHD）平衡状态以及相关生成设置，为优化和机器学习研究者提供了宝贵的资源，旨在降低恒星器设计的门槛，推动跨学科研究进展。数据集采用MIT许可协议，包含丰富的特征字段，如边界参数、性能指标及优化设置等，为聚变能源研究提供了重要的数据支持。

当前挑战

ConStellaration数据集面临的挑战主要集中在两个方面：领域问题的复杂性与数据构建的技术难度。在领域问题方面，恒星器设计涉及高维、约束性强的优化问题，需要精确的物理模拟和深厚的专业知识，尤其是在准等动力条件的实现上存在显著挑战。数据构建过程中，由于恒星器边界形状的多样性和复杂性，数据采集与处理的精度要求极高，同时需要处理大规模的计算任务，确保数据的可靠性与一致性。此外，数据集还需应对不同优化方法（如DESC、VMEC等）的兼容性问题，以及错误处理的鲁棒性挑战。

常用场景

经典使用场景

在磁约束聚变研究领域，ConStellaration数据集为优化准等动力（QI）仿星器边界形状提供了丰富的数据支持。该数据集通过包含多样化的等离子体边界形态及其对应的理想磁流体动力学（MHD）平衡状态，成为研究人员验证新型仿星器设计算法的基准平台。经典使用场景涉及利用数据集中的边界参数和性能指标，训练机器学习模型以预测不同边界形状对等离子体约束性能的影响。

实际应用

在实际工程应用中，该数据集直接服务于下一代仿星器装置的设计优化。聚变能源开发团队可通过分析数据集中的高性能边界构型，提取具有最优约束特性的几何特征。数据集包含的VMEC平衡计算结果可直接用于电磁线圈系统设计，而边界傅里叶系数则为三维真空室加工提供了数学描述，加速了从理论设计到工程实现的转化过程。

衍生相关工作

基于该数据集已衍生出多项重要研究工作，包括开发融合物理先验知识的神经网络架构，以及建立仿星器设计的自动化优化流程。部分研究利用数据集中的全参数化边界描述，开发了基于深度学习的磁场位形预测模型。另有工作结合数据集提供的初始优化设置，提出了混合智能优化算法，显著提升了寻找高性能仿星器构型的效率。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集