five

VQEzy

收藏
arXiv2025-09-22 更新2025-09-24 收录
下载链接:
https://github.com/chizhang24/VQEzy
下载链接
链接失效反馈
官方服务:
资源简介:
VQEzy 是一个用于变分量子本征解算器 (VQE) 参数初始化的开源大规模数据集,涵盖了量子多体物理、量子化学和随机基准测试三个主要领域,包含 12,110 个实例,每个实例都包含完整的 VQE 规范和优化轨迹。该数据集旨在解决 VQE 训练中对参数初始化敏感的问题,支持 VQE 初始化、跨任务迁移学习和 VQE 架构设计等研究。

VQEzy is an open-source large-scale dataset for parameter initialization of the Variational Quantum Eigensolver (VQE). It covers three core domains: quantum many-body physics, quantum chemistry, and random benchmarking, and consists of 12,110 instances. Each instance includes complete VQE specifications and optimization trajectories. This dataset is designed to address the problem of parameter initialization sensitivity in VQE training, and supports research including VQE initialization, cross-task transfer learning, and VQE architecture design.
提供机构:
美国佛罗里达中央大学、印第安纳大学
创建时间:
2025-09-22
原始信息汇总

VQEzy 数据集概述

数据集简介

VQEzy 是一个大规模数据集,收集了涵盖 3 个领域和 7 个应用任务的 12,110 个实例。每个实例包含目标 VQE 哈密顿量的完整描述、完整优化轨迹以及优化后的最优参数。

主要贡献

  • VQEzy 是首个跨越大规模和多种 VQE 应用的数据集,与先前工作(少于 500 个实例)相比具有显著优势。
  • VQEzy 记录了全面的 VQE 优化数据,每个实例包含丰富属性:目标哈密顿量、拟设架构、最优参数和完整优化轨迹。

应用领域

  • VQE 初始化和优化。
  • VQE 任务间的迁移学习。
  • VQE 架构设计与研究。

数据集特征统计

应用领域 任务 哈密顿量 拟设 哈密顿量参数 参数数量 量子比特数 特征维度 实例数量
量子多体物理 1D_XYZ Eq. (Heisenberg XYZ) Fig. (a) 耦合常数 (J₁, J₂, J₃) 8 4 1×8 2000
量子多体物理 1D_XYZ Eq. (Heisenberg XYZ) Fig. (a) 耦合常数 (J₁, J₂, J₃) 24 12 1×24 2000
量子多体物理 1D_FH Eq. (1D FH) Fig. (a) 跳跃t 和相互作用 U 8 4 1×8 1000
量子多体物理 1D_FH Eq. (1D FH) Fig. (a) 跳跃t 和相互作用 U 12 6 1×12 1000
量子多体物理 1D_FH Eq. (1D FH) Fig. (a) 跳跃t 和相互作用 U 16 8 1×16 1000
量子多体物理 2D_TFI Eq. (2D TFI) Fig. (a) 耦合j 和场强 μ 16 8 1×16 1000
量子化学 H₂ Utkarsh (2023) Fig. (b) H–H 键长 24 4 1×24 150
量子化学 HeH⁺ Utkarsh (2023) Fig. (b) He–H 键长 24 4 1×24 1000
量子化学 NH₃ Utkarsh (2023) Fig. (b) N–H 键长 336 16 1×336 160
随机 VQE Random_VQE Li (2023, QASMBench) Fig. (c) 泡利字符串系数 48 4 1×48 2800

哈密顿量定义

  • Heisenberg XYZ:$$hat{H} = sum_{i=0}^3 Big( J_1 X_i X_{i+1} + J_2 Y_i Y_{i+1} + J_3 Z_i Z_{i+1} Big)$$
  • 1D FH:$$hat{H} = -t sum_{i=0}^{n-1} ig( hat{c}^dagger_i hat{c}{i+1} + hat{c}{i+1}hat{c}i ig) + U sum{i=0}^{n-1} hat{n}i hat{n}{i+1}$$
  • 2D TFI:$$hat{H} = -j sum_{i,j} Z_i Z_j ;-; mu sum_i Z_i$$

数据集结构

  • 数据集存储在 3 个子文件夹中:qmanybodyqchemqasmbench,分别对应量子多体物理、量子化学和随机 VQE 应用。
  • figures 子文件夹包含论文中使用的所有图表,由 visualization.ipynb Jupyter 笔记本绘制。
  • ansatz.py 脚本包含所有使用的拟设定义。
  • data_samply.py 脚本包含用于采样数据集中实例的所有主要函数。

使用说明

安装依赖

  • 使用 uv 管理 Python 环境。
  • 建议在 Ubuntu 22.04 LTS 机器上使用 CUDA 版本 12.8 重现依赖关系。
  • 安装步骤:
    1. 克隆仓库:git clone https://github.com/chizhang24/VQEzy.git
    2. VQEzy 文件夹中运行:uv sync
搜集汇总
数据集介绍
main_image_url
构建方式
在变分量子本征求解器研究领域,VQEzy数据集通过三阶段构建流程实现全面覆盖。首先基于PennyLane和TorchQuantum框架生成三大应用领域的哈密顿量:量子多体物理领域采用系统化参数采样策略,如一维XYZ模型在4和12量子比特链上对耦合常数进行0.1精度的网格采样;量子化学领域通过调节分子键长构建H2、HeH+和NH3的哈密顿量集合;随机VQE领域则生成2800个具有半整数泡利系数的四量子比特哈密顿量。随后针对不同领域选用专用ansatz电路结构,包括多体物理的CZRXRY ansatz、量子化学的强纠缠ansatz以及随机基准测试的U3CU3 ansatz。最终采用Adam优化器进行大规模VQE优化,在NVIDIA RTX 3090 GPU上累计运行超过200小时,完整记录每个实例的优化轨迹和最终参数。
特点
作为当前最全面的VQE参数初始化数据集,VQEzy展现出三大核心特征。其规模优势显著,涵盖量子多体物理、量子化学和随机基准测试三大领域共7个代表性任务,提供12,110个实例,数量级远超现有数据集。数据完整性突出,每个实例不仅包含优化后的参数向量,还提供完整的哈密顿量描述、ansatz电路规格以及全程优化轨迹数据。领域多样性丰富,通过t-SNE和MDS可视化分析显示,不同任务的优化参数在特征空间中形成明显聚类,如多体物理任务中1D XYZ与2D TFI模型参数分布界限清晰,量子化学分子系统参数按键长变化呈现规律性分布,而随机VQE参数则展现无偏的扩散结构,这种结构特征为跨任务迁移学习研究提供了理想基础。
使用方法
该数据集为VQE研究社区提供了多维度应用支持。在参数初始化方面,研究者可直接调用优化参数作为初始点,或基于大规模数据训练机器学习模型生成新任务的智能初始化策略。跨任务迁移学习应用可通过对比不同领域参数分布规律,探索参数可迁移性机制,例如利用多体物理任务训练的元学习模型快速适配量子化学系统。在电路架构设计领域,完整的地面态能量分布和优化轨迹为ansatz搜索算法提供基准测试环境,支持基于深度学习的量子电路架构自动搜索。数据集采用标准化HDF5格式存储,配套Python脚本可直接加载哈密顿量和电路数据,研究人员可根据特征维度选择相应实例子集,或通过提供的元数据筛选特定量子比特规模和ansatz类型的实验配置。
背景与挑战
背景概述
变分量子本征求解器(VQE)作为嘈杂中等规模量子(NISQ)时代的关键算法,在量子多体物理、量子化学等领域展现出巨大潜力。然而,VQE的性能高度依赖于参数初始化策略,不恰当的初始化易导致优化过程陷入局部最优或遭遇 barren plateau 问题。为系统研究VQE参数初始化,中佛罗里达大学与印第安纳大学的研究团队于2025年联合发布了VQEzy数据集,该数据集覆盖三大应用领域、七类代表性任务,包含12,110个完整VQE实例,首次实现了对哈密顿量、拟设电路及优化轨迹的全方位记录,为VQE算法的可复现性与泛化性研究奠定了数据基础。
当前挑战
VQEzy数据集致力于解决VQE参数初始化领域的两大核心挑战:其一,在算法层面,VQE对初始参数的敏感性导致收敛性能不稳定,且不同领域的哈密顿结构差异进一步增加了跨任务泛化难度;其二,在数据集构建过程中,需克服领域覆盖狭窄(如现有数据仅限单一物理或化学系统)、规模有限(通常仅数百实例)以及数据属性不完整(缺失优化轨迹或电路结构)等瓶颈。VQEzy通过统一采样协议、多维度参数空间构建及大规模优化实验,首次实现了跨域、多尺度VQE数据的系统性整合。
常用场景
经典使用场景
在变分量子本征求解器的研究领域中,VQEzy数据集为参数初始化提供了关键支持。该数据集覆盖量子多体物理、量子化学和随机基准测试三大领域,包含七类代表性任务和超过1.2万个实例,其完整的哈密顿量、量子电路规格及优化轨迹记录,使研究者能够系统分析不同初始参数对收敛速度和精度的影响。通过提供多样化的初始化起点,VQEzy显著降低了传统随机初始化导致的局部最优陷阱风险,成为评估新型初始化算法的标准基准。
实际应用
该数据集在量子计算实际部署中具有重要价值,尤其在噪声中等规模量子设备上优化化学模拟与材料计算流程。例如,在分子能级计算任务中,利用VQEzy预训练的初始化参数可缩短H2、HeH+等分子体系的收敛时间,降低经典优化器的迭代成本。此外,其包含的随机VQE基准数据为量子硬件性能测试提供了无偏评估环境,助力开发适应特定量子处理器的鲁棒性算法。
衍生相关工作
VQEzy催生了多项创新研究,如基于神经网络的参数预测模型NN-AE-VQE和扩散增强优化方法,这些工作利用其完整轨迹数据提升初始化效率。在架构搜索方向,QuantumNAS等框架将该数据集作为评估基准,探索噪声自适应量子电路设计。同时,其多任务特性支撑了量子模型无关元学习的研究,例如Q-MAML通过跨哈密顿量泛化验证了参数迁移的可行性,推动了VQE与其他量子算法的融合创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作