five

SQuASH dataset

收藏
arXiv2025-06-07 更新2025-06-11 收录
下载链接:
https://github.com/SQuASH-bench/SQuASH
下载链接
链接失效反馈
官方服务:
资源简介:
SQuASH数据集是一个为量子架构搜索(QAS)方法设计的大型数据集,包含超过300万个独特的参数化量子电路(PQC)。该数据集由Fraunhofer FOKUS和柏林自由大学的研究团队创建,旨在通过使用代理模型来加速QAS方法的评估,并促进QAS方法的可重复性和进一步研究。数据集涵盖了两个不同的任务:量子态制备和数据点分类,每个任务都有预定义的搜索空间和预训练的代理模型,以预测优化后的PQC性能。数据集的创建过程涉及使用强化学习、遗传算法和随机搜索策略来探索预定义的搜索空间,并生成和优化候选PQC。SQuASH数据集适用于评估各种QAS方法,特别是那些将参数优化作为搜索过程内循环的方法。

The SQuASH dataset is a large-scale dataset designed for quantum architecture search (QAS) methods, containing over 3 million unique parameterized quantum circuits (PQCs). Developed by a research team from Fraunhofer FOKUS and the Free University of Berlin, this dataset aims to accelerate the evaluation of QAS approaches via surrogate models, while facilitating the reproducibility and further research of QAS methods. The dataset covers two distinct tasks: quantum state preparation and data point classification. Each task is equipped with a predefined search space and a pre-trained surrogate model to predict the performance of optimized PQCs. The creation of the SQuASH dataset involved using reinforcement learning, genetic algorithms, and random search strategies to explore the predefined search space, as well as generate and optimize candidate PQCs. The SQuASH dataset is suitable for evaluating various QAS methods, particularly those that treat parameter optimization as an inner loop of the search process.
提供机构:
Fraunhofer FOKUS, Berlin, Germany; Freie Universit¨at Berlin, Berlin, Germany
创建时间:
2025-06-07
搜集汇总
数据集介绍
main_image_url
构建方式
SQuASH数据集通过系统化的方法构建,旨在为量子架构搜索(QAS)提供统一的基准评估框架。数据集的构建基于三种策略:强化学习(RL)、遗传算法(GA)和随机搜索,每种策略均通过多轮随机种子生成和优化候选参数化量子电路(PQCs)。数据收集过程中,每个生成的电路及其元数据(如初始和优化后的电路结构、保真度或分类准确率等)均被序列化为.pickle文件,并通过哈希值去重以确保数据唯一性。此外,针对数据不平衡问题,采用了数据增强技术,例如通过门集缩减和优化级别调整来扩展高保真度电路样本。
特点
SQuASH数据集的核心特点在于其多样化的搜索空间设计和高效的代理模型支持。数据集涵盖两种任务(量子态制备和线性分类)和三个预定义的搜索空间(GHZ_a、GHZ_b和LS_a),每个搜索空间均规定了门集、量子比特数、最大电路深度等约束条件。数据集包含超过300万个独特的PQCs,并提供了初始和优化后的电路参数信息。此外,预训练的代理模型(如图神经网络和随机森林)能够显著加速QAS方法的评估,通过预测电路性能替代实际量子硬件模拟,从而降低计算成本。
使用方法
SQuASH数据集的使用方法包括基准测试和代理模型集成。研究人员可通过开源代码库将数据集和代理模型嵌入自定义QAS流程中,利用预定义的搜索空间和评估协议进行方法对比。代理模型支持快速性能预测,适用于以参数优化为内循环的QAS方法,例如通过阈值筛选高潜力电路后再进行实际评估。数据集还可用于训练生成模型或增强强化学习算法的演示缓冲。具体操作包括加载序列化电路数据、调用代理模型接口,以及根据任务需求(如保真度或分类准确率)优化搜索策略。
背景与挑战
背景概述
SQuASH数据集由德国弗劳恩霍夫FOKUS研究所与柏林自由大学的研究团队于2025年提出,旨在解决量子架构搜索(QAS)领域缺乏标准化评估基准的难题。作为首个基于代理模型的量子电路设计基准,该数据集聚焦参数化量子电路(PQCs)的自动化设计,覆盖量子态制备和线性分类两大核心任务,包含超过300万组独特电路结构及其优化参数。其创新性地引入经典回归模型预测量子电路性能,显著降低了传统QAS方法所需的巨额计算资源,为量子机器学习(QML)和自动量子架构搜索(AutoQML)研究提供了可扩展的评估框架。
当前挑战
该数据集面临的领域挑战包括:1)量子电路性能预测的精度瓶颈,尤其在处理高保真度电路时存在显著误差重叠;2)不同搜索空间(如GHZ_b)中电路结构的量子特性对经典代理模型构成建模障碍。构建过程中的技术挑战涉及:1)数据不平衡问题,需通过门集转换等增强策略优化高保真电路样本;2)量子-经典数据表征的异构性,要求设计特殊的图神经网络架构处理量子电路的DAG表达;3)评估协议标准化难题,需建立兼顾RL、遗传算法等多范式搜索策略的统一度量体系。
常用场景
经典使用场景
SQuASH数据集在量子架构搜索(QAS)领域中被广泛用于加速和标准化不同QAS方法的评估流程。通过提供预训练的代理模型,该数据集使得研究人员能够快速预测参数化量子电路(PQCs)的性能,从而显著减少传统方法中所需的计算资源。经典使用场景包括在量子态制备和线性分类任务中,利用代理模型替代实际量子硬件执行,大幅缩短实验周期并提升研究效率。
衍生相关工作
该数据集衍生出多项量子计算与经典机器学习交叉的创新工作。例如,基于其图神经网络(GNN)代理模型架构,研究者开发了GSQAS等自监督量子架构搜索框架;其公开的300万条PQC数据被用于训练量子扩散模型(如Quantum Circuit Synthesis with Diffusion Models),推动了生成式量子电路设计的发展。此外,数据集启发了QAS-Bench等后续基准的构建,形成量子自动机器学习(AutoQML)的评估生态体系。
数据集最近研究
最新研究方向
量子计算领域近年来在参数化量子电路(PQCs)的设计与优化方面取得了显著进展,而SQuASH数据集的推出为量子架构搜索(QAS)提供了统一的基准评估框架。该数据集通过引入代理模型(surrogate models)显著降低了QAS方法的计算资源需求,为量子电路的结构优化和性能预测提供了高效工具。研究热点集中在如何利用图神经网络(GNN)和随机森林(RF)等经典机器学习模型,准确预测量子电路的性能指标,如保真度和分类准确率。SQuASH的发布不仅加速了量子架构搜索的实证研究,还推动了量子机器学习(QML)与自动量子机器学习(AutoQML)领域的标准化进程,为复杂量子任务的电路设计开辟了新路径。
相关研究论文
  • 1
    Benchmarking Quantum Architecture Search with Surrogate AssistanceFraunhofer FOKUS, Berlin, Germany; Freie Universit¨at Berlin, Berlin, Germany · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作