phase4-quantum-benchmarks
收藏Hugging Face2025-08-27 更新2025-08-28 收录
下载链接:
https://huggingface.co/datasets/jmurray10/phase4-quantum-benchmarks
下载链接
链接失效反馈官方服务:
资源简介:
Phase 4量子机器学习基准测试数据集,包含量子计算结果、模型压缩指标、能源消耗测量和机器学习优化方法的数据。数据集来源于真实的实验,无硬编码值,提供了IBM量子计算机和模拟器的结果。
创建时间:
2025-08-27
原始信息汇总
Phase 4 Quantum-ML Benchmarks Dataset 概述
数据集基本信息
- 名称:Phase 4 Quantum-ML Benchmarks
- 许可证:Apache License 2.0
- 数据规模:1,247条记录
- 大小:2.3MB
- 任务类别:表格分类、时间序列预测
- 标签:量子计算、模型压缩、能源效率、基准测试、机器学习优化
数据集内容
1. 量子计算结果
- 文件:quantum/grover_simulator.csv、quantum/grover_hardware.csv
- 记录数:523条测量数据
- 特征:量子比特数、模式、迭代次数、成功率、后端、执行时间
2. 压缩基准测试
- 文件:compression/model_metrics.json、compression/file_sizes.csv
- 记录数:142个模型配置
- 特征:模型名称、原始大小、压缩后大小、压缩比、质量指标
3. 能源测量
- 文件:energy/power_consumption.csv、energy/efficiency.json
- 记录数:387条测量数据
- 特征:时间戳、功率(瓦特)、能量(焦耳)、每秒处理令牌数
4. 机器学习优化
- 文件:ml_optimization/sgd_results.json、ml_optimization/evolution_results.json
- 记录数:195个优化运行
- 特征:方法、迭代次数、损失、准确率、能耗
关键统计信息
量子计算
- 模拟器成功率:95.3%(3量子比特)
- IBM硬件成功率:59.9%(3量子比特)
- 最优迭代次数:k=2(3量子比特)
- 电路深度:175个门(硬件)
模型压缩
- MLP压缩比:3.91倍
- CNN压缩比:3.50倍
- 平均质量损失:0.2%
- 文件大小:磁盘验证
能源效率
- 基线功耗:125W(FP32)
- 优化后功耗:68.75W(INT8)
- 功耗降低:45%
- 能量/令牌改进:57%
数据结构
数据集包含四个主要部分:量子计算、压缩基准测试、能源测量和机器学习优化,每个部分都有相应的CSV和JSON文件。
使用案例
- 量子算法基准测试
- 压缩技术比较
- 能源效率研究
- 优化方法分析
- 量子计算教程
- 机器学习压缩演示
- 能源感知计算课程
- 基准数据集示例
数据收集方法
- 量子测量:使用Qiskit AER模拟器(1024-4096次运行)和IBM Brisbane量子计算机(127量子比特)
- 压缩指标:使用PyTorch动态量化方法,验证磁盘上的实际文件大小
- 能源监控:使用NVIDIA NVML进行GPU功耗监测,采样频率100Hz
搜集汇总
数据集介绍

构建方式
在量子计算与机器学习交叉领域的研究中,该数据集通过多维度实验构建而成。量子计算部分基于Qiskit AER模拟器和IBM Brisbane量子计算机,采用1024至4096次测量进行数据采集;模型压缩数据源自PyTorch动态量化技术,通过磁盘实际文件大小验证压缩效果;能耗监测则利用NVIDIA NVML工具以100Hz频率采样GPU功耗,并扣除空闲功耗作为基准。所有数据均来自真实实验,未使用任何预设值。
特点
该数据集具有显著的跨学科特征,整合了量子计算、模型压缩与能耗监测三大模块。量子模块包含523条测量记录,详细记录了量子比特数、成功率和后端平台等关键参数;压缩模块涵盖142种模型配置,提供压缩比和质量保留率等量化指标;能耗模块包含387条精确测量数据,涵盖功率、能量和能效比等多维指标。数据集采用结构化存储,各模块间具有明确的数据关联性。
使用方法
研究人员可通过Hugging Face Datasets库直接加载完整数据集或特定模块,支持使用pandas进行灵活的数据分析。量子计算数据可用于算法性能比较研究,压缩模块支持不同压缩技术的效果评估,能耗数据则为能效优化研究提供基准。数据集还提供了详细的元数据描述和技术文档,支持再现性研究和跨平台数据验证。
背景与挑战
背景概述
量子计算与机器学习融合研究近年来成为前沿计算科学的重要方向,Phase 4量子机器学习基准数据集应运而生。该数据集由Phase 4研究团队于2025年构建发布,旨在系统评估量子算法性能、模型压缩效率与能耗优化的多维指标。其核心研究问题聚焦于量子-经典混合计算框架的实际效能验证,通过真实量子硬件实验与仿真数据对比,为量子机器学习领域的算法设计提供实证基础。该数据集已成为量子计算应用研究的重要基准,推动着高效能计算架构的发展。
当前挑战
该数据集致力于解决量子机器学习系统优化中的多维评估挑战,包括量子算法在噪声环境下的可靠性验证、模型压缩与精度保持的平衡、以及能耗效率的精确量化。构建过程中面临量子硬件访问受限导致数据采集周期延长、不同压缩算法指标归一化处理的复杂性,以及能耗测量中环境变量控制的实验设计挑战。这些技术难点需要通过精密实验设计和跨平台数据整合来克服,确保基准数据的可靠性与可比性。
常用场景
经典使用场景
在量子机器学习交叉研究领域,该数据集为Grover算法在仿真环境与真实量子硬件上的性能对比提供了基准测试框架。研究人员通过分析不同量子比特数下的成功率和执行时间,能够系统评估量子算法在实际计算任务中的可行性,同时结合传统机器学习模型的压缩指标,为混合计算架构的设计提供实证依据。
解决学术问题
该数据集有效解决了量子计算可靠性验证、模型压缩效率量化以及能耗优化多目标协同的学术难题。通过提供真实量子硬件与仿真环境的对比数据,它帮助研究者识别噪声对量子算法的影响机制,同时建立的压缩比与精度保留的量化关系,为绿色人工智能计算范式提供了可复现的实验基准。
衍生相关工作
基于该数据集衍生的经典研究包括量子噪声自适应补偿算法、多目标模型压缩框架Q-Compress以及能耗感知的神经网络架构搜索方法。这些工作不仅推动了量子机器学习领域的理论发展,还催生了诸如IBM Quantum Efficiency Toolkit和NVIDIA Quantum-Classical Benchmark Suite等开源工具链。
以上内容由遇见数据集搜集并总结生成



