five

phase4-quantum-benchmarks

收藏
Hugging Face2025-08-27 更新2025-08-28 收录
下载链接:
https://huggingface.co/datasets/jmurray10/phase4-quantum-benchmarks
下载链接
链接失效反馈
官方服务:
资源简介:
Phase 4量子机器学习基准测试数据集,包含量子计算结果、模型压缩指标、能源消耗测量和机器学习优化方法的数据。数据集来源于真实的实验,无硬编码值,提供了IBM量子计算机和模拟器的结果。
创建时间:
2025-08-27
原始信息汇总

Phase 4 Quantum-ML Benchmarks Dataset 概述

数据集基本信息

  • 名称:Phase 4 Quantum-ML Benchmarks
  • 许可证:Apache License 2.0
  • 数据规模:1,247条记录
  • 大小:2.3MB
  • 任务类别:表格分类、时间序列预测
  • 标签:量子计算、模型压缩、能源效率、基准测试、机器学习优化

数据集内容

1. 量子计算结果

  • 文件:quantum/grover_simulator.csv、quantum/grover_hardware.csv
  • 记录数:523条测量数据
  • 特征:量子比特数、模式、迭代次数、成功率、后端、执行时间

2. 压缩基准测试

  • 文件:compression/model_metrics.json、compression/file_sizes.csv
  • 记录数:142个模型配置
  • 特征:模型名称、原始大小、压缩后大小、压缩比、质量指标

3. 能源测量

  • 文件:energy/power_consumption.csv、energy/efficiency.json
  • 记录数:387条测量数据
  • 特征:时间戳、功率(瓦特)、能量(焦耳)、每秒处理令牌数

4. 机器学习优化

  • 文件:ml_optimization/sgd_results.json、ml_optimization/evolution_results.json
  • 记录数:195个优化运行
  • 特征:方法、迭代次数、损失、准确率、能耗

关键统计信息

量子计算

  • 模拟器成功率:95.3%(3量子比特)
  • IBM硬件成功率:59.9%(3量子比特)
  • 最优迭代次数:k=2(3量子比特)
  • 电路深度:175个门(硬件)

模型压缩

  • MLP压缩比:3.91倍
  • CNN压缩比:3.50倍
  • 平均质量损失:0.2%
  • 文件大小:磁盘验证

能源效率

  • 基线功耗:125W(FP32)
  • 优化后功耗:68.75W(INT8)
  • 功耗降低:45%
  • 能量/令牌改进:57%

数据结构

数据集包含四个主要部分:量子计算、压缩基准测试、能源测量和机器学习优化,每个部分都有相应的CSV和JSON文件。

使用案例

  • 量子算法基准测试
  • 压缩技术比较
  • 能源效率研究
  • 优化方法分析
  • 量子计算教程
  • 机器学习压缩演示
  • 能源感知计算课程
  • 基准数据集示例

数据收集方法

  • 量子测量:使用Qiskit AER模拟器(1024-4096次运行)和IBM Brisbane量子计算机(127量子比特)
  • 压缩指标:使用PyTorch动态量化方法,验证磁盘上的实际文件大小
  • 能源监控:使用NVIDIA NVML进行GPU功耗监测,采样频率100Hz
搜集汇总
数据集介绍
main_image_url
构建方式
在量子计算与机器学习交叉领域的研究中,该数据集通过多维度实验构建而成。量子计算部分基于Qiskit AER模拟器和IBM Brisbane量子计算机,采用1024至4096次测量进行数据采集;模型压缩数据源自PyTorch动态量化技术,通过磁盘实际文件大小验证压缩效果;能耗监测则利用NVIDIA NVML工具以100Hz频率采样GPU功耗,并扣除空闲功耗作为基准。所有数据均来自真实实验,未使用任何预设值。
特点
该数据集具有显著的跨学科特征,整合了量子计算、模型压缩与能耗监测三大模块。量子模块包含523条测量记录,详细记录了量子比特数、成功率和后端平台等关键参数;压缩模块涵盖142种模型配置,提供压缩比和质量保留率等量化指标;能耗模块包含387条精确测量数据,涵盖功率、能量和能效比等多维指标。数据集采用结构化存储,各模块间具有明确的数据关联性。
使用方法
研究人员可通过Hugging Face Datasets库直接加载完整数据集或特定模块,支持使用pandas进行灵活的数据分析。量子计算数据可用于算法性能比较研究,压缩模块支持不同压缩技术的效果评估,能耗数据则为能效优化研究提供基准。数据集还提供了详细的元数据描述和技术文档,支持再现性研究和跨平台数据验证。
背景与挑战
背景概述
量子计算与机器学习融合研究近年来成为前沿计算科学的重要方向,Phase 4量子机器学习基准数据集应运而生。该数据集由Phase 4研究团队于2025年构建发布,旨在系统评估量子算法性能、模型压缩效率与能耗优化的多维指标。其核心研究问题聚焦于量子-经典混合计算框架的实际效能验证,通过真实量子硬件实验与仿真数据对比,为量子机器学习领域的算法设计提供实证基础。该数据集已成为量子计算应用研究的重要基准,推动着高效能计算架构的发展。
当前挑战
该数据集致力于解决量子机器学习系统优化中的多维评估挑战,包括量子算法在噪声环境下的可靠性验证、模型压缩与精度保持的平衡、以及能耗效率的精确量化。构建过程中面临量子硬件访问受限导致数据采集周期延长、不同压缩算法指标归一化处理的复杂性,以及能耗测量中环境变量控制的实验设计挑战。这些技术难点需要通过精密实验设计和跨平台数据整合来克服,确保基准数据的可靠性与可比性。
常用场景
经典使用场景
在量子机器学习交叉研究领域,该数据集为Grover算法在仿真环境与真实量子硬件上的性能对比提供了基准测试框架。研究人员通过分析不同量子比特数下的成功率和执行时间,能够系统评估量子算法在实际计算任务中的可行性,同时结合传统机器学习模型的压缩指标,为混合计算架构的设计提供实证依据。
解决学术问题
该数据集有效解决了量子计算可靠性验证、模型压缩效率量化以及能耗优化多目标协同的学术难题。通过提供真实量子硬件与仿真环境的对比数据,它帮助研究者识别噪声对量子算法的影响机制,同时建立的压缩比与精度保留的量化关系,为绿色人工智能计算范式提供了可复现的实验基准。
衍生相关工作
基于该数据集衍生的经典研究包括量子噪声自适应补偿算法、多目标模型压缩框架Q-Compress以及能耗感知的神经网络架构搜索方法。这些工作不仅推动了量子机器学习领域的理论发展,还催生了诸如IBM Quantum Efficiency Toolkit和NVIDIA Quantum-Classical Benchmark Suite等开源工具链。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作