GraphNet
收藏arXiv2025-10-28 更新2025-11-04 收录
下载链接:
https://github.com/PaddlePaddle/GraphNet
下载链接
链接失效反馈官方服务:
资源简介:
GraphNet 是一个包含 2.7K 个真实世界深度学习计算图的大型数据集,跨越了多个深度学习框架下的六个主要任务类别。该数据集旨在为张量编译器研究提供全面评估。GraphNet 的样本涵盖了从几千到 10B 参数的各种规模的模型,支持多种数据类型,如 BF16、FP16 和 FP32。GraphNet 通过自动化流程从主流深度学习框架中提取计算图,并确保所有样本均符合可运行、可序列化、可分解、可静态分析和可访问自定义操作符等约束条件。该数据集可用于评估和开发张量编译器,帮助研究人员和开发人员识别性能瓶颈,指导下一代张量编译器的进化。
GraphNet is a large-scale dataset containing 2.7K real-world deep learning computation graphs, spanning six major task categories across multiple deep learning frameworks. This dataset aims to provide comprehensive evaluations for tensor compiler research. Samples in GraphNet cover models of various scales ranging from thousands to 10 billion parameters, and support multiple data types such as BF16, FP16 and FP32. GraphNet extracts computation graphs from mainstream deep learning frameworks via an automated pipeline, and ensures that all samples meet constraints including being runnable, serializable, decomposable, statically analyzable, and supporting access to custom operators. This dataset can be used to evaluate and develop tensor compilers, assisting researchers and developers in identifying performance bottlenecks and guiding the evolution of next-generation tensor compilers.
提供机构:
百度
创建时间:
2025-10-28
搜集汇总
数据集介绍
构建方式
在深度学习编译器研究领域,GraphNet通过自动化流程构建了包含2700个真实计算图的数据集。该流程采用轻量级提取机制,利用框架内置的符号追踪技术动态捕获算子调用与张量依赖关系,形成标准化的计算图样本。为确保数据质量,验证阶段采用重提取与重执行双重校验机制,通过对比两次提取结果的结构一致性和执行输出,严格保障样本的可运行性、可序列化与静态可分析性。
特点
作为面向张量编译器研究的大规模数据集,GraphNet展现出三大核心特性。其真实性体现在所有样本均源自主流深度学习框架的实践模型,覆盖计算机视觉与自然语言处理等六大任务领域;兼容性通过统一存储格式实现,完整保留计算语义并支持多编译器后端无缝对接;多样性则表现为模型规模从千级到百亿参数的广泛分布,并全面支持BF16/FP16/FP32等精度格式,为编译器优化提供多维评估场景。
使用方法
针对张量编译器的系统化评估,GraphNet设计了完整的自动化评测工作流。该流程以原始模型的Eager模式执行结果为基准,通过配置目标编译器生成优化后的可执行文件,经预热处理后采集纯执行时间。性能分析阶段创新性地提出加速比评分St指标,综合考量运行时加速比、数值正确性与编译失败情况,并进一步扩展出支持误差分类的ESt评分,为编译器开发者提供细粒度性能瓶颈定位依据。
背景与挑战
背景概述
随着深度学习模型对异构硬件计算效率需求的日益增长,张量编译器技术成为优化计算图执行性能的核心工具。GraphNet数据集由百度PaddlePaddle团队于2025年提出,旨在通过涵盖六大任务类别、跨框架的2700个真实计算图样本,构建系统化的张量编译器评估基准。该数据集通过标准化格式整合计算图语义与元数据,支持CINN、TorchInductor等多后端编译器,为编译器优化能力量化与性能瓶颈分析提供了重要基础设施。
当前挑战
在领域问题层面,GraphNet需解决张量编译器在动态精度支持与跨平台复杂算法优化中的泛化性挑战,其提出的加速评分指标需平衡运行效率与数值正确性的矛盾关系。构建过程中面临真实计算图语义完整性保持、多框架算子异构性统一、以及自定义算子可追溯性等工程难题,同时需通过重复提取验证机制确保样本可运行性与静态分析可行性。
常用场景
经典使用场景
在深度学习编译器研究领域,GraphNet数据集为张量编译器的系统化评估提供了标准化测试平台。该数据集收录了2700余个真实场景下的深度学习计算图,涵盖计算机视觉、自然语言处理等六大任务类别,支持跨框架的编译器性能对比分析。研究人员通过统一的评估流程,能够客观衡量不同编译器在算子融合、内存优化等关键环节的表现,为编译器算法的改进提供可靠依据。
实际应用
在工业实践中,GraphNet为深度学习框架的编译器选型提供了决策支持。企业可根据特定任务类型和框架需求,基于数据集中的性能基准选择最优编译器配置。例如在自然语言处理场景中,通过对比CINN与TorchInductor在NLP样本上的表现,开发者能够针对性地优化推理性能。同时,该数据集支持的多种硬件后端评估,助力企业在异构计算环境中实现资源的最优配置。
衍生相关工作
基于GraphNet的评估框架催生了一系列编译器优化研究。部分工作专注于改进计算图分解算法,提升子图融合效率;另有研究利用数据集中丰富的错误信息,开发了面向特定故障模式的自动修复机制。在AI驱动的编译器研究方向上,该数据集为基于大语言模型的算子生成方法提供了训练与验证基准,推动了智能编译技术的发展。这些衍生工作共同构成了张量编译器研究的新范式。
以上内容由遇见数据集搜集并总结生成



