Aurora data

github2025-01-22 更新2025-02-10 收录

下载链接：

https://github.com/XanaduAI/xanadu-aurora-data

下载链接

链接失效反馈

官方服务：

资源简介：

该仓库包含用于访问、处理和可视化在Nature论文《Scaling and networking a modular photonic quantum computer》中展示的数据的工具。数据公开托管在S3存储桶中，可以通过`s3_download.py`中的`download_and_load_file`函数下载。数据集分为两个主要目录，分别对应两个实验演示：集群状态获取和解码器演示。集群状态获取的数据分为1,440个文件，每个文件对应图3b中的一个数据点；解码器演示的数据压缩为一个17.5 GB的zip文件，解压后为36 GB。

This repository contains tools for accessing, processing, and visualizing the data presented in the Nature paper 'Scaling and networking a modular photonic quantum computer'. The data is publicly hosted in an S3 bucket and can be downloaded using the `download_and_load_file` function in the `s3_download.py` script. The dataset is divided into two main directories, corresponding to two experimental demonstrations: cluster state acquisition and decoder demonstration. The data for cluster state acquisition is split into 1,440 files, each corresponding to a data point in Figure 3b; the decoder demonstration data is compressed into a 17.5 GB zip file, which expands to 36 GB upon extraction.

创建时间：

2025-01-18

原始信息汇总

Aurora数据集概述

数据集来源

数据来源于Nature论文"Scaling and networking a modular photonic quantum computer"中展示的实验数据。

数据获取方式

通过s3_download.py中的download_and_load_file函数从公开的S3存储桶下载。
提供data_download_and_processing_demo.ipynb作为数据下载和处理的演示。

文件结构

集群态获取实验(对应论文图3b)

数据文件：1,440个，每个458MB
关键文件：
- cluster_state/u_dagger.npy：宏节点分束器应用的逆酉矩阵
- cluster_state/quadratures_vacuum.npy：真空态下的正交分量数据(12个空间模式，1000万个时间bin)
- cluster_state/{q or p}-measurement/quadratures_batch_{0..720}.npy：在$hat{q}$或$hat{p}$测量期间获取的正交分量数据

解码器演示实验(对应论文图3c,3d)

数据总量：压缩文件17.5GB，解压后36GB
包含三种实验条件：
- signal/：常规解码条件下的数据
- random/：随机测量基的控制实验数据
- vacuum/：自适应测量基但关闭压缩光源的数据
每批次数据包含：
- quadratures.npy：正交分量数据(12个模式，100万个时间bin)
- switch_settings_mux_{2 or 3}_{top or bot}.npy：多路复用器输入索引
- switch_settings_qpu_{0..5}.npy：每个宏节点的测量基设置
- decisions.npy：解码器决策位(仅signal和random目录)

绘图数据

提供xanadu_aurora_plot_data.xlsx电子表格，包含图3b、3c和3d中展示的数据点

使用要求

Python 3.11环境
需安装requirements.txt中指定的依赖包

搜集汇总

数据集介绍

构建方式

Aurora数据集是依据《Scaling and networking a modular photonic quantum computer》Nature论文的研究成果构建而成。该数据集存储在公共的S3存储桶中，通过`s3_download.py`中的`download_and_load_file`函数可以实现数据的下载与加载。数据集的构建主要围绕两个实验展示，分别是对集群态的获取和解码器的演示，数据被组织为多个文件和目录，以方便进行独立的数据处理和分析。

特点

该数据集的特点在于其详尽的数据分类和大规模的数据量。集群态获取数据被细分为1440个文件，每个文件代表图中的一个数据点，每个文件大小为458MB。解码器演示数据则被压缩为一个17.5GB的zip文件，解压后达到36GB。此外，数据集还包含了用于生成图表的测量数据，以及相关的测量基础和解码决策信息，为研究量子计算机的扩展和网络化提供了丰富的实验数据。

使用方法

使用该数据集首先需要搭建Python环境，推荐使用Python 3.11，并通过`pip install -r requirements.txt`安装必要的包。数据下载和处理的示例代码可在`data_download_and_processing_demo.ipynb`中找到。数据存储在两个主要目录中，每个目录对应一个实验展示。用户可以根据需求下载相应的数据文件，利用Python工具进行数据的处理和分析。此外，数据集还提供了用于绘图的Excel表格，方便用户进行结果的可视化展示。

背景与挑战

背景概述

Aurora数据集源自一篇发表于Nature的论文《Scaling and networking a modular photonic quantum computer》，该论文详细展示了量子计算机模块化扩展和网络化的研究成果。该数据集由相关研究人员创建，旨在为量子计算领域提供实验数据，以供进一步的研究与验证。数据集托管于S3存储桶中，通过Python工具可以下载并处理数据，其研究成果对量子信息科学的发展具有重大影响力。

当前挑战

Aurora数据集面临的挑战主要涉及数据处理的复杂性。首先，数据集文件体积庞大，单个数据点文件大小达到458MB，且解压缩后总量达到36GB，对存储和计算资源提出较高要求。其次，数据集包含了多种类型的测量数据，需要相应的算法来处理和解析这些数据。此外，构建过程中确保数据质量和实验的准确性也是一项挑战，尤其是在处理大规模量子态的获取和解码演示时。

常用场景

经典使用场景

Aurora数据集是量子计算领域的重要资源，其经典使用场景在于为科研人员提供了一个全面的研究平台，用于分析和验证量子计算机中的关键过程。该数据集包含了创建量子纠缠态、执行量子测量和进行量子解码的实验数据，科研人员可借此深入探索量子计算的底层原理和实现技术。

实际应用

在实际应用方面，Aurora数据集为量子信息处理、量子通信和量子模拟等领域提供了实验基础。它使得科研人员能够基于真实数据测试和开发量子协议，对提升量子技术的实用性和推广量子计算的应用范围具有重要意义。

衍生相关工作

基于Aurora数据集，已经衍生出一系列相关的研究工作，包括量子态的制备与验证、量子纠错技术的开发、量子算法的性能分析等。这些研究不仅扩展了量子计算的理论边界，也为量子技术的商业化发展奠定了坚实的基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集