phase4-quantum-benchmarks

Hugging Face2025-08-27 更新2025-08-28 收录

下载链接：

https://huggingface.co/datasets/jmurray10/phase4-quantum-benchmarks

下载链接

链接失效反馈

官方服务：

资源简介：

Phase 4量子机器学习基准测试数据集，包含量子计算结果、模型压缩指标、能源消耗测量和机器学习优化方法的数据。数据集来源于真实的实验，无硬编码值，提供了IBM量子计算机和模拟器的结果。

创建时间：

2025-08-27

原始信息汇总

Phase 4 Quantum-ML Benchmarks Dataset 概述

数据集基本信息

名称：Phase 4 Quantum-ML Benchmarks
许可证：Apache License 2.0
数据规模：1,247条记录
大小：2.3MB
任务类别：表格分类、时间序列预测
标签：量子计算、模型压缩、能源效率、基准测试、机器学习优化

数据集内容

1. 量子计算结果

文件：quantum/grover_simulator.csv、quantum/grover_hardware.csv
记录数：523条测量数据
特征：量子比特数、模式、迭代次数、成功率、后端、执行时间

2. 压缩基准测试

文件：compression/model_metrics.json、compression/file_sizes.csv
记录数：142个模型配置
特征：模型名称、原始大小、压缩后大小、压缩比、质量指标

3. 能源测量

文件：energy/power_consumption.csv、energy/efficiency.json
记录数：387条测量数据
特征：时间戳、功率（瓦特）、能量（焦耳）、每秒处理令牌数

4. 机器学习优化

文件：ml_optimization/sgd_results.json、ml_optimization/evolution_results.json
记录数：195个优化运行
特征：方法、迭代次数、损失、准确率、能耗

关键统计信息

量子计算

模拟器成功率：95.3%（3量子比特）
IBM硬件成功率：59.9%（3量子比特）
最优迭代次数：k=2（3量子比特）
电路深度：175个门（硬件）

模型压缩

MLP压缩比：3.91倍
CNN压缩比：3.50倍
平均质量损失：0.2%
文件大小：磁盘验证

能源效率

基线功耗：125W（FP32）
优化后功耗：68.75W（INT8）
功耗降低：45%
能量/令牌改进：57%

数据结构

数据集包含四个主要部分：量子计算、压缩基准测试、能源测量和机器学习优化，每个部分都有相应的CSV和JSON文件。

使用案例

量子算法基准测试
压缩技术比较
能源效率研究
优化方法分析
量子计算教程
机器学习压缩演示
能源感知计算课程
基准数据集示例

数据收集方法

量子测量：使用Qiskit AER模拟器（1024-4096次运行）和IBM Brisbane量子计算机（127量子比特）
压缩指标：使用PyTorch动态量化方法，验证磁盘上的实际文件大小
能源监控：使用NVIDIA NVML进行GPU功耗监测，采样频率100Hz

搜集汇总

数据集介绍

构建方式

在量子计算与机器学习交叉领域的研究中，该数据集通过多维度实验构建而成。量子计算部分基于Qiskit AER模拟器和IBM Brisbane量子计算机，采用1024至4096次测量进行数据采集；模型压缩数据源自PyTorch动态量化技术，通过磁盘实际文件大小验证压缩效果；能耗监测则利用NVIDIA NVML工具以100Hz频率采样GPU功耗，并扣除空闲功耗作为基准。所有数据均来自真实实验，未使用任何预设值。

特点

该数据集具有显著的跨学科特征，整合了量子计算、模型压缩与能耗监测三大模块。量子模块包含523条测量记录，详细记录了量子比特数、成功率和后端平台等关键参数；压缩模块涵盖142种模型配置，提供压缩比和质量保留率等量化指标；能耗模块包含387条精确测量数据，涵盖功率、能量和能效比等多维指标。数据集采用结构化存储，各模块间具有明确的数据关联性。

使用方法

研究人员可通过Hugging Face Datasets库直接加载完整数据集或特定模块，支持使用pandas进行灵活的数据分析。量子计算数据可用于算法性能比较研究，压缩模块支持不同压缩技术的效果评估，能耗数据则为能效优化研究提供基准。数据集还提供了详细的元数据描述和技术文档，支持再现性研究和跨平台数据验证。

背景与挑战

背景概述

量子计算与机器学习融合研究近年来成为前沿计算科学的重要方向，Phase 4量子机器学习基准数据集应运而生。该数据集由Phase 4研究团队于2025年构建发布，旨在系统评估量子算法性能、模型压缩效率与能耗优化的多维指标。其核心研究问题聚焦于量子-经典混合计算框架的实际效能验证，通过真实量子硬件实验与仿真数据对比，为量子机器学习领域的算法设计提供实证基础。该数据集已成为量子计算应用研究的重要基准，推动着高效能计算架构的发展。

当前挑战

该数据集致力于解决量子机器学习系统优化中的多维评估挑战，包括量子算法在噪声环境下的可靠性验证、模型压缩与精度保持的平衡、以及能耗效率的精确量化。构建过程中面临量子硬件访问受限导致数据采集周期延长、不同压缩算法指标归一化处理的复杂性，以及能耗测量中环境变量控制的实验设计挑战。这些技术难点需要通过精密实验设计和跨平台数据整合来克服，确保基准数据的可靠性与可比性。

常用场景

经典使用场景

在量子机器学习交叉研究领域，该数据集为Grover算法在仿真环境与真实量子硬件上的性能对比提供了基准测试框架。研究人员通过分析不同量子比特数下的成功率和执行时间，能够系统评估量子算法在实际计算任务中的可行性，同时结合传统机器学习模型的压缩指标，为混合计算架构的设计提供实证依据。

解决学术问题

该数据集有效解决了量子计算可靠性验证、模型压缩效率量化以及能耗优化多目标协同的学术难题。通过提供真实量子硬件与仿真环境的对比数据，它帮助研究者识别噪声对量子算法的影响机制，同时建立的压缩比与精度保留的量化关系，为绿色人工智能计算范式提供了可复现的实验基准。

衍生相关工作

基于该数据集衍生的经典研究包括量子噪声自适应补偿算法、多目标模型压缩框架Q-Compress以及能耗感知的神经网络架构搜索方法。这些工作不仅推动了量子机器学习领域的理论发展，还催生了诸如IBM Quantum Efficiency Toolkit和NVIDIA Quantum-Classical Benchmark Suite等开源工具链。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集