five

MNISQ

收藏
arXiv2023-06-29 更新2024-06-21 收录
下载链接:
https://github.com/FujiiLabCollaboration/MNISQ-quantum-circuit-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MNISQ数据集是由大阪大学的QIQB实验室创建的一个大规模量子电路数据集,包含4,950,000个数据点,分为9个子数据集。该数据集通过量子编码经典信息(如MNIST数据集)生成,提供量子形式(电路)和经典形式(量子编程语言QASM描述)的双重形式。MNISQ旨在通过量子机器学习(QML)和经典机器学习方法解决分类问题,展示量子计算在机器学习中的潜在优势。数据集的应用领域包括量子计算和机器学习的交叉研究,特别是在量子优势的探索和量子电路的分类识别上。

The MNISQ dataset is a large-scale quantum circuit dataset created by the QIQB Laboratory of Osaka University, containing 4,950,000 data points and divided into 9 sub-datasets. It is generated by encoding classical information (such as the MNIST dataset) via quantum techniques, and provides two formats: the quantum format (quantum circuits) and the classical format (described using the quantum programming language QASM). MNISQ aims to solve classification problems using both quantum machine learning (QML) and classical machine learning methods, and demonstrate the potential advantages of quantum computing in machine learning. The application areas of this dataset cover interdisciplinary research at the intersection of quantum computing and machine learning, particularly in the exploration of quantum advantage and the classification and recognition of quantum circuits.
提供机构:
大阪大学 - QIQB 大阪, 日本
创建时间:
2023-06-29
搜集汇总
数据集介绍
main_image_url
构建方式
在嘈杂中等规模量子计算时代,量子机器学习领域亟需标准化基准数据集。MNISQ数据集通过自动量子电路编码方法,将经典图像数据集嵌入量子态的概率幅中。该方法以MNIST、Fashion-MNIST和Kuzushiji-MNIST三类图像数据为源,通过优化量子门配置与参数,生成能够将经典向量编码为量子态的量子电路。数据生成过程设置了80%、90%和95%三种保真度阈值,并通过旋转、裁剪等图像增强技术将原始训练样本扩展至48万条,最终形成包含495万数据点的九个子数据集。
特点
该数据集具备双重表征形式,既包含可直接在量子模拟器上执行的量子电路,也提供标准量子汇编语言描述的QASM文件。这种设计使得数据集能同时服务于量子机器学习与经典机器学习研究。数据集规模达到百万级别,覆盖三种不同保真度层次,为模型性能比较提供了丰富维度。特别值得注意的是,数据集通过系统化的数据增强策略,有效提升了机器学习模型的泛化能力,其结构化存储格式便于研究者快速调用与验证。
使用方法
研究者可通过MNISQ开源库直接加载量子电路数据,该库支持在Qulacs等量子模拟框架中即时执行嵌入操作。对于经典机器学习任务,可将QASM文件进行词元化处理后,输入Transformer、LSTM或S4等序列模型进行分类训练。量子机器学习应用则可采用量子支持向量机方法,通过计算量子核矩阵实现高效分类。数据集提供两种QASM格式:包含专有Dense算子的版本适用于Qulacs平台,而基础QASM版本则兼容Qiskit等多种量子计算框架。
背景与挑战
背景概述
在嘈杂中等规模量子(NISQ)时代,量子计算与机器学习的交叉研究面临数据资源匮乏的挑战。为此,大阪大学与RIKEN的研究团队于2023年推出了MNISQ数据集,这是首个面向量子与经典机器学习社区的大规模量子电路数据集。该数据集包含495万个数据点,通过自动量子电路编码(AQCE)方法将经典图像数据(如MNIST)嵌入量子态振幅,并以量子电路及量子汇编语言(QASM)的双重形式呈现。其核心研究问题在于探索量子机器学习在实用任务中的潜在优势,同时评估经典机器学习对量子电路的理解能力,为量子计算与机器学习的协同发展提供了关键基准。
当前挑战
MNISQ数据集旨在解决量子机器学习中的核心挑战:在NISQ设备上实现有意义的量子优势验证,并推动经典机器学习对量子电路的理解。具体挑战包括:其一,在领域问题层面,量子机器学习需在图像分类等实际任务中证明其相对于经典方法的优越性,而当前量子硬件噪声与规模限制使得这一目标难以实现;其二,在数据集构建过程中,大规模量子电路的生成面临计算复杂度高、存储成本大的难题,且需在量子形式与经典描述之间保持数据一致性与可访问性。此外,如何设计既能体现量子特性又适于经典模型训练的数据格式,亦是构建过程中的关键挑战。
常用场景
经典使用场景
在嘈杂中等规模量子计算时代,量子机器学习领域亟需大规模基准数据集以评估算法性能。MNISQ数据集通过自动量子电路编码技术,将经典图像数据嵌入量子态振幅,生成了包含495万个数据点的量子电路集合。该数据集最经典的使用场景是作为量子核方法与经典序列模型的分类基准,研究者利用其双形式(量子电路与QASM描述)同时开展量子支持向量机与结构化状态空间模型的对比实验,为量子优势验证提供了标准化测试平台。
实际应用
该数据集的实际应用价值体现在量子算法开发与硬件测试的多个层面。量子计算框架(如Qulacs、Qiskit)可直接加载其标准化的QASM文件进行电路模拟与硬件部署,加速变分量子算法的原型验证。在量子错误缓解研究中,不同保真度子数据集为噪声表征提供了梯度化测试样本。工业界可借鉴其数据生成流程,将经典传感器数据编码为量子电路格式,探索量子感知在边缘计算中的潜在应用,为NISQ设备实用化铺平道路。
衍生相关工作
MNISQ数据集催生了量子电路表示学习的新研究方向。基于其QASM序列数据,研究者开发了针对量子程序语言的专用分词器与嵌入方法,推动了量子自然语言处理分支的形成。在架构创新方面,该数据集验证了结构化状态空间模型在长序列量子电路分类中的优越性,启发了量子经典混合神经网络的设计。衍生工作还包括量子电路压缩算法研究,通过分析数据集中的门序列冗余模式,开发出适用于近量子硬件的电路优化工具链。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作