Aurora data
收藏github2025-01-22 更新2025-02-10 收录
下载链接:
https://github.com/XanaduAI/xanadu-aurora-data
下载链接
链接失效反馈官方服务:
资源简介:
该仓库包含用于访问、处理和可视化在Nature论文《Scaling and networking a modular photonic quantum computer》中展示的数据的工具。数据公开托管在S3存储桶中,可以通过`s3_download.py`中的`download_and_load_file`函数下载。数据集分为两个主要目录,分别对应两个实验演示:集群状态获取和解码器演示。集群状态获取的数据分为1,440个文件,每个文件对应图3b中的一个数据点;解码器演示的数据压缩为一个17.5 GB的zip文件,解压后为36 GB。
This repository contains tools for accessing, processing, and visualizing the data presented in the Nature paper 'Scaling and networking a modular photonic quantum computer'. The data is publicly hosted in an S3 bucket and can be downloaded using the `download_and_load_file` function in the `s3_download.py` script. The dataset is divided into two main directories, corresponding to two experimental demonstrations: cluster state acquisition and decoder demonstration. The data for cluster state acquisition is split into 1,440 files, each corresponding to a data point in Figure 3b; the decoder demonstration data is compressed into a 17.5 GB zip file, which expands to 36 GB upon extraction.
创建时间:
2025-01-18
原始信息汇总
Aurora数据集概述
数据集来源
- 数据来源于Nature论文"Scaling and networking a modular photonic quantum computer"中展示的实验数据。
数据获取方式
- 通过
s3_download.py中的download_and_load_file函数从公开的S3存储桶下载。 - 提供
data_download_and_processing_demo.ipynb作为数据下载和处理的演示。
文件结构
集群态获取实验(对应论文图3b)
- 数据文件:1,440个,每个458MB
- 关键文件:
cluster_state/u_dagger.npy:宏节点分束器应用的逆酉矩阵cluster_state/quadratures_vacuum.npy:真空态下的正交分量数据(12个空间模式,1000万个时间bin)cluster_state/{q or p}-measurement/quadratures_batch_{0..720}.npy:在$hat{q}$或$hat{p}$测量期间获取的正交分量数据
解码器演示实验(对应论文图3c,3d)
- 数据总量:压缩文件17.5GB,解压后36GB
- 包含三种实验条件:
signal/:常规解码条件下的数据random/:随机测量基的控制实验数据vacuum/:自适应测量基但关闭压缩光源的数据
- 每批次数据包含:
quadratures.npy:正交分量数据(12个模式,100万个时间bin)switch_settings_mux_{2 or 3}_{top or bot}.npy:多路复用器输入索引switch_settings_qpu_{0..5}.npy:每个宏节点的测量基设置decisions.npy:解码器决策位(仅signal和random目录)
绘图数据
- 提供
xanadu_aurora_plot_data.xlsx电子表格,包含图3b、3c和3d中展示的数据点
使用要求
- Python 3.11环境
- 需安装
requirements.txt中指定的依赖包
搜集汇总
数据集介绍

构建方式
Aurora数据集是依据《Scaling and networking a modular photonic quantum computer》Nature论文的研究成果构建而成。该数据集存储在公共的S3存储桶中,通过`s3_download.py`中的`download_and_load_file`函数可以实现数据的下载与加载。数据集的构建主要围绕两个实验展示,分别是对集群态的获取和解码器的演示,数据被组织为多个文件和目录,以方便进行独立的数据处理和分析。
特点
该数据集的特点在于其详尽的数据分类和大规模的数据量。集群态获取数据被细分为1440个文件,每个文件代表图中的一个数据点,每个文件大小为458MB。解码器演示数据则被压缩为一个17.5GB的zip文件,解压后达到36GB。此外,数据集还包含了用于生成图表的测量数据,以及相关的测量基础和解码决策信息,为研究量子计算机的扩展和网络化提供了丰富的实验数据。
使用方法
使用该数据集首先需要搭建Python环境,推荐使用Python 3.11,并通过`pip install -r requirements.txt`安装必要的包。数据下载和处理的示例代码可在`data_download_and_processing_demo.ipynb`中找到。数据存储在两个主要目录中,每个目录对应一个实验展示。用户可以根据需求下载相应的数据文件,利用Python工具进行数据的处理和分析。此外,数据集还提供了用于绘图的Excel表格,方便用户进行结果的可视化展示。
背景与挑战
背景概述
Aurora数据集源自一篇发表于Nature的论文《Scaling and networking a modular photonic quantum computer》,该论文详细展示了量子计算机模块化扩展和网络化的研究成果。该数据集由相关研究人员创建,旨在为量子计算领域提供实验数据,以供进一步的研究与验证。数据集托管于S3存储桶中,通过Python工具可以下载并处理数据,其研究成果对量子信息科学的发展具有重大影响力。
当前挑战
Aurora数据集面临的挑战主要涉及数据处理的复杂性。首先,数据集文件体积庞大,单个数据点文件大小达到458MB,且解压缩后总量达到36GB,对存储和计算资源提出较高要求。其次,数据集包含了多种类型的测量数据,需要相应的算法来处理和解析这些数据。此外,构建过程中确保数据质量和实验的准确性也是一项挑战,尤其是在处理大规模量子态的获取和解码演示时。
常用场景
经典使用场景
Aurora数据集是量子计算领域的重要资源,其经典使用场景在于为科研人员提供了一个全面的研究平台,用于分析和验证量子计算机中的关键过程。该数据集包含了创建量子纠缠态、执行量子测量和进行量子解码的实验数据,科研人员可借此深入探索量子计算的底层原理和实现技术。
实际应用
在实际应用方面,Aurora数据集为量子信息处理、量子通信和量子模拟等领域提供了实验基础。它使得科研人员能够基于真实数据测试和开发量子协议,对提升量子技术的实用性和推广量子计算的应用范围具有重要意义。
衍生相关工作
基于Aurora数据集,已经衍生出一系列相关的研究工作,包括量子态的制备与验证、量子纠错技术的开发、量子算法的性能分析等。这些研究不仅扩展了量子计算的理论边界,也为量子技术的商业化发展奠定了坚实的基础。
以上内容由遇见数据集搜集并总结生成



