QMapDataset

github2025-10-31 更新2025-11-01 收录

下载链接：

https://github.com/rscadrien/QMapDataset

下载链接

链接失效反馈

官方服务：

资源简介：

QMapDataset是一个用于生成量子硬件上量子比特映射和电路编译研究数据集的Python包。它可以为真实的IBM Quantum后端和自定义的加扰后端创建数据集，以压缩的JSON友好格式存储电路、硬件属性以及逻辑到物理量子比特的映射。该数据集特别适用于量子比特映射和转换优化方面的机器学习研究。

QMapDataset is a Python package for generating datasets for quantum qubit mapping and circuit compilation research on quantum hardware. It can generate datasets for both real IBM Quantum backends and custom scrambled quantum backends, storing circuits, hardware properties, and logical-to-physical qubit mappings in a compressed, JSON-friendly format. This dataset is particularly well-suited for machine learning research focused on qubit mapping and transformation optimization.

创建时间：

2025-10-30

原始信息汇总

QMapDataset 数据集概述

数据集简介

QMapDataset 是一个用于生成量子比特映射和电路编译研究数据集的 Python 包。该数据集专门用于量子硬件上的机器学习研究，特别关注量子比特映射和转换优化。

主要功能

生成著名量子电路（如 Grover、QFT、Shor）或完全随机电路
生成硬件后端：
- 真实的 IBM Quantum 后端
- 具有置换量子比特特性和门错误的定制后端
自动存储每个样本的详细信息

数据结构

每个样本包含三个压缩的 JSON 文件：

hardware.json.gz

包含硬件属性：

层级类型：真实或定制
量子比特数量
基础门集合
耦合映射
T1 和 T2 弛豫时间
单量子比特错误率
多量子比特错误率

circuit.json.gz

包含电路信息：

电路层级：著名或随机
算法信息
逻辑量子比特数量
电路深度
单量子比特门计数
双量子比特门计数

mapping.json.gz

包含映射信息：

逻辑量子比特数量
物理量子比特数量
转换后的最终映射关系

输入参数

n_samples：要生成的数据集样本数量
backend_name：用于电路转换和硬件属性的 IBM Quantum 后端名称
hard_probs：选择真实与定制后端的概率（默认 0.65 真实，0.35 定制）
circuit_probs：选择著名与随机电路的概率（默认各 0.5）
prob_depth：随机电路深度层级的概率分布（浅层、中等、深层、极深）
save_path：数据集样本保存的文件夹路径

技术特性

使用压缩 JSON 格式存储数据
支持真实和定制量子硬件后端
提供电路转换后的逻辑到物理量子比特映射
包含完整的硬件性能指标和错误率信息

许可证

MIT 许可证

搜集汇总

数据集介绍

构建方式

在量子计算研究领域，QMapDataset通过系统化采样策略构建多样化数据集。该数据集采用参数化生成机制，用户可指定样本数量、后端类型及电路类型概率分布，自动调用IBM Quantum真实硬件或定制化后端进行电路编译。每个样本独立生成硬件配置文件、量子电路描述和逻辑-物理量子比特映射关系，通过随机置换量子比特属性与分层深度控制，确保数据覆盖不同复杂度场景。所有数据均以标准化JSON格式压缩存储，保持数据结构的一致性与可复用性。

特点

该数据集的核心特征体现在多维度量子计算要素的集成记录。硬件层面同时收录真实IBM量子设备与自定义扰动的虚拟后端，完整保存量子比特弛豫时间、退相干误差及门操作保真度等关键参数。电路数据涵盖Grover、QFT等经典算法与随机生成电路，并精确统计单双量子门数量、电路深度等编译指标。独特的逻辑-物理映射数据为量子比特布局优化研究提供直接支撑，三层JSON结构通过压缩存储实现高效数据交换，满足机器学习模型对结构化量子计算数据的需求。

使用方法

研究者可通过调整概率参数灵活生成定制化数据集，n_samples控制样本规模，backend_name指定目标量子硬件，hard_probs与circuit_probs分别调节真实/自定义后端与经典/随机电路的生成比例。prob_depth参数实现对电路深度的分层控制，生成脚本自动执行电路编译与映射优化流程。用户仅需配置保存路径即可获得完整数据包，每个样本文件夹包含硬件属性、电路特征与最终映射的三类压缩文件，可直接加载至量子机器学习框架进行模型训练与验证。

背景与挑战

背景概述

量子计算领域面临的核心挑战之一在于如何将逻辑量子电路高效映射至物理硬件，这一过程受到量子比特拓扑连接与噪声特性的严格制约。QMapDataset由研究团队于量子计算软硬件协同设计兴起阶段创建，专注于构建量子比特映射与电路编译研究的标准化数据集。该数据集整合了真实IBM量子后端与自定义扰码硬件架构，系统收录了包括Grover算法、量子傅里叶变换等典型量子电路的编译数据，为机器学习驱动的量子编译优化研究提供了关键数据支撑。

当前挑战

在量子电路编译领域，量子比特映射问题需克服硬件拓扑约束与噪声环境带来的双重挑战，包括最小化通信开销与优化门序列深度。数据集构建过程中面临多维复杂度：需平衡真实硬件数据采集与自定义参数仿真的代表性，处理量子电路随机生成与著名算法电路的多样性配置，同时确保传输层优化过程中逻辑-物理映射关系的可追溯性。数据标准化存储亦需解决量子硬件参数异构性与电路编译动态特性的统一表征难题。

常用场景

经典使用场景

在量子计算硬件研究中，QMapDataset为量子比特映射和电路编译问题提供了标准化的数据支持。该数据集通过生成包含著名量子算法与随机电路的多样化样本，结合真实IBM量子后端及定制化硬件配置，成为评估映射算法性能的基准平台。研究人员可基于其压缩的JSON格式数据，系统分析不同硬件约束下逻辑到物理量子比特的映射效率，推动量子编译流程的优化研究。

衍生相关工作

基于QMapDataset的结构化数据，学界涌现出多项量子编译优化研究。例如结合图神经网络的动态映射策略，通过学习硬件耦合图与电路特征的关系，实现了低延迟量子比特分配；另有工作利用强化学习框架，以数据集中的门错误率为奖励信号，开发出噪声感知的编译流水线。这些衍生研究共同推动了量子软硬件协同设计范式的形成，为未来大规模量子计算资源管理奠定基础。

数据集最近研究