MNIST, Fashion-MNIST, CIFAR-10, Imagenette
收藏arXiv2025-05-06 更新2025-05-08 收录
下载链接:
https://pennylane.ai/datasets/collection/low-depth-image-circuits
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于评估量子机器学习模型性能的一系列图像数据集,包括MNIST、Fashion-MNIST、CIFAR-10和Imagenette。这些数据集被转换为低深度量子电路,以便在量子计算机上高效地加载和处理。数据集的创建目的是为了评估量子分类器的性能,并与经典卷积神经网络进行比较。数据集的访问地址是pennylane.ai/datasets/collection/low-depth-image-circuits。
This dataset is a suite of image datasets for evaluating the performance of quantum machine learning models, including MNIST, Fashion-MNIST, CIFAR-10, and Imagenette. These datasets are converted into low-depth quantum circuits to enable efficient loading and processing on quantum computers. The dataset is developed to evaluate the performance of quantum classifiers and facilitate comparisons with classical convolutional neural networks. The access URL of this dataset is pennylane.ai/datasets/collection/low-depth-image-circuits.
提供机构:
慕尼黑工业大学, 德国
创建时间:
2025-05-06
搜集汇总
数据集介绍

构建方式
该数据集通过量子计算技术构建,利用低深度量子电路将经典图像数据高效编码为量子态。具体采用FRQI(Flexible Representation of Quantum Images)和MCRQI(Multi-Channel Representation of Quantum Images)两种编码方式,分别处理灰度图像和彩色图像。通过矩阵积态(MPS)和量子电路优化算法,实现了对数级量子比特需求和线性级电路深度的数据加载方案。
特点
该数据集的核心特点在于其高效的量子态编码能力,能够将高维经典图像数据压缩为低纠缠量子态。通过分层索引(Z-order)技术,进一步降低了量子态的纠缠熵,使得量子电路近似误差随电路层数呈代数衰减。数据集覆盖MNIST、Fashion-MNIST、CIFAR-10和Imagenette四类标准机器学习数据集,实现了从简单手写数字到复杂自然图像的全尺度测试。
使用方法
该数据集专为量子机器学习基准测试设计,可通过PennyLane平台直接调用优化后的量子电路。使用流程包括:1)加载预编译的量子电路参数;2)输入经典图像数据生成量子态;3)连接变分量子分类器、量子核方法或张量网络分类器等模型进行训练评估。特别适用于研究量子数据编码效率、量子分类器非线性表达能力等前沿问题。
背景与挑战
背景概述
MNIST、Fashion-MNIST、CIFAR-10和Imagenette是机器学习领域的经典数据集,广泛应用于图像分类任务的研究与评估。MNIST数据集由Yann LeCun等人于1998年创建,包含手写数字的灰度图像,是早期机器学习研究的重要基准。Fashion-MNIST作为MNIST的替代品,由Han Xiao等人于2017年发布,包含时尚物品图像,提供了更具挑战性的分类任务。CIFAR-10由Alex Krizhevsky在2009年整理,包含10个类别的彩色图像,是计算机视觉研究的重要数据集。Imagenette是ImageNet的子集,由Jeremy Howard于2019年创建,旨在提供更小规模但更具现实意义的图像分类任务。这些数据集在推动机器学习算法的发展,特别是在深度学习与量子机器学习领域的研究中发挥了关键作用。
当前挑战
这些数据集在量子机器学习(QML)中面临多重挑战。首先,量子计算机需要将经典图像数据高效编码为量子态,但现有编码方法如振幅编码和旋转编码在资源消耗与计算效率上存在显著瓶颈。其次,构建量子分类器时,模型在简单数据集(如MNIST)上表现良好,但在复杂数据集(如CIFAR-10)上性能显著下降,难以与经典方法竞争。此外,量子电路的深度与宽度限制了其处理高分辨率图像的能力,且量子噪声与误差进一步加剧了分类任务的难度。最后,缺乏标准化的量子机器学习基准,使得不同模型的性能难以直接比较。
常用场景
经典使用场景
MNIST、Fashion-MNIST、CIFAR-10和Imagenette数据集在量子机器学习(QML)领域被广泛用于评估量子分类器的性能。这些数据集分别包含手写数字、时尚物品、彩色物体和复杂场景的图像,为量子算法提供了从简单到复杂的多层级测试平台。通过将经典图像数据编码为量子态,研究者能够系统性地考察量子核方法、参数化量子电路等模型在图像分类任务中的表现,尤其关注量子优势在真实数据上的可扩展性验证。
实际应用
在实际应用中,这些经过量子电路编码的数据集可直接用于金融手写体识别、电子商务商品分类等工业场景。例如,Fashion-MNIST的量子化版本可加速时尚推荐系统的特征提取;CIFAR-10的压缩量子表示能提升自动驾驶中物体识别的能效比。特别值得注意的是,论文提供的PennyLane公开数据集使研究者能快速验证量子图像处理算法在128×128高分辨率图像(如Imagenette)上的可行性,推动了量子计算机视觉的实际部署。
衍生相关工作
该工作催生了多个量子机器学习的重要研究方向:基于FRQI/MCRQI编码的变分量子分类器架构优化、结合张量网络的混合量子-经典压缩算法,以及量子核方法在图像数据上的理论分析。后续研究如量子卷积神经网络(QCNN)的基准测试、矩阵乘积态分类器的设计都直接受此启发。论文中提出的层级索引策略和分块编码技术更成为量子数据加载领域的标准方法,被广泛应用于量子生成对抗网络等衍生工作中。
以上内容由遇见数据集搜集并总结生成



