InferBench

github2025-12-21 更新2025-12-22 收录

下载链接：

https://github.com/BinSquare/inferbench

下载链接

链接失效反馈

官方服务：

资源简介：

用户贡献和用户验证的硬件性能数据库，用于LLM硬件基准测试。

A user-contributed and user-validated hardware performance database for LLM hardware benchmark testing.

创建时间：

2025-12-09

原始信息汇总

InferBench 数据集概述

数据集简介

InferBench 是一个关于硬件推理性能的用户贡献与用户验证数据库。

数据内容

数据涵盖硬件性能指标，具体包括：

GPU 数据
CPU 数据
模型数据
定价数据

数据来源与维护

数据由用户贡献并验证。
硬件数据（GPU、CPU、模型、定价）存储于项目源代码的 src/lib/hardware-data.ts 文件中。
用户可通过 https://inferbench.com 提交基准测试结果。

使用与贡献

项目采用 MIT 许可证。
鼓励用户提交基准测试结果以丰富数据集。
提交贡献前需运行构建命令。

搜集汇总

数据集介绍

构建方式

在人工智能硬件性能评估领域，InferBench数据集采用了一种开放协作的构建模式。该数据集的核心数据来源于社区用户的主动贡献与验证，用户通过专门的在线平台提交各类硬件在推理任务上的性能基准测试结果。为确保数据的可靠性与一致性，项目维护者将硬件规格、模型信息及市场价格等元数据集中管理于统一的配置文件中，便于后续的更新与维护。这种构建方式不仅促进了数据的持续积累，也增强了数据集的代表性与时效性。

特点

InferBench数据集聚焦于硬件推理性能的横向比较，其显著特点在于数据的社区驱动与实时更新特性。数据集涵盖了多种主流GPU、CPU在不同模型上的推理速度、效率及成本指标，并整合了市场价格信息，为性价比分析提供了多维度的依据。所有提交的数据均经过用户间的交叉验证，确保了基准测试结果的可信度。这一开放结构使得数据集能够敏捷地反映新兴硬件与模型的技术演进，成为动态的性能参考基准。

使用方法

研究人员与开发者可通过克隆项目仓库并配置本地环境来使用InferBench数据集。项目提供了完整的开发栈，用户需安装依赖并连接至兼容的PostgreSQL数据库以启动本地服务。数据集的核心数据可通过项目网站进行交互式查询与可视化，亦可通过程序化方式访问结构化的硬件性能元数据。对于希望贡献数据的用户，项目明确了提交基准测试结果的在线流程，并要求在代码合并前执行构建检查，以保障数据质量与项目完整性。

背景与挑战

背景概述

随着人工智能模型部署需求的日益增长，硬件推理性能评估成为优化计算资源与成本效益的关键环节。InferBench作为一个开源社区驱动的数据库，专注于收集与验证各类硬件在模型推理任务上的性能数据。该数据集由BinSquare等研究人员或机构发起，旨在构建一个透明、可扩展的基准平台，以应对模型部署中硬件选型与性能预测的核心研究问题。其创建推动了硬件-软件协同设计领域的发展，为研究者和工程师提供了实证依据，促进了高效推理系统的实践探索。

当前挑战

在领域问题层面，InferBench致力于解决硬件推理性能标准化评估的挑战，包括不同硬件架构（如GPU、CPU）在多样化模型负载下的效率比较，以及性能与成本权衡的量化分析。构建过程中，数据集面临数据质量与一致性的难题，例如用户贡献数据的验证机制、硬件规格动态更新的维护，以及跨平台性能指标的归一化处理。此外，社区协作的可持续性与数据覆盖范围的扩展，亦是确保数据集长期价值的关键挑战。

常用场景

经典使用场景

在人工智能硬件性能评估领域，InferBench数据集为研究人员和工程师提供了一个用户贡献与验证的推理性能数据库。该数据集最经典的使用场景在于支持硬件选型与优化，用户能够基于实际基准测试结果，比较不同GPU和CPU在运行各类机器学习模型时的推理速度、功耗及成本效益。通过系统化的性能数据，从业者可以快速识别适合特定应用场景的硬件配置，从而在模型部署前进行精准的性能预测与资源规划。

解决学术问题

InferBench数据集有效解决了机器学习硬件性能评估中数据稀缺与标准化不足的学术研究问题。传统上，硬件推理性能数据分散且缺乏统一验证，导致研究难以进行公平比较与可重复实验。该数据集通过众包方式收集并验证硬件性能指标，为学术界提供了可靠的基础数据，支持硬件效率分析、能耗建模以及推理优化算法的开发，推动了边缘计算与云推理系统的性能评估方法学进展。

衍生相关工作

围绕InferBench数据集，衍生出多项经典研究工作，主要集中在硬件感知的模型压缩与推理加速领域。例如，基于该数据集的性能特征，研究者开发了自适应推理框架，能够动态调整模型精度以匹配硬件能力；同时，也有工作利用这些数据训练硬件性能预测模型，自动化推荐最优部署配置。这些衍生成果进一步丰富了高效推理系统的理论与实践，促进了AI硬件协同设计的前沿探索。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集