Swan

Name: Swan
Creator: 密歇根大学
Published: 2023-09-06 11:23:20
License: 暂无描述

arXiv2023-09-06 更新2024-06-21 收录

下载链接：

https://github.com/arkhadem/Swan

下载链接

链接失效反馈

官方服务：

资源简介：

Swan是由密歇根大学开发的一个面向移动应用的向量处理基准套件，包含59个多样化的数据并行工作负载，源自操作系统、网页浏览器、音视频消息应用及PDF渲染引擎等四个常用移动应用。该数据集通过深入分析性能、功耗和能耗，揭示了向量处理在移动设备上的优势与局限。创建过程中，研究团队详细研究了四个广泛使用的移动应用的源代码，并从12个常用库中精心挑选了代表性的工作负载。Swan的应用领域主要集中在探索CPU向量处理在移动平台上的性能，旨在解决移动设备资源受限环境下的性能优化问题。

Swan is a mobile application-oriented vector processing benchmark suite developed by the University of Michigan. It comprises 59 diverse data-parallel workloads derived from four widely used mobile application categories: operating systems, web browsers, audio/video messaging apps, and PDF rendering engines. This benchmark suite reveals the advantages and limitations of vector processing on mobile devices through in-depth analysis of performance, power consumption, and energy usage. During its development, the research team conducted a detailed study of the source code of four prevalent mobile applications, and carefully selected representative workloads from 12 commonly used libraries. The primary application domain of Swan focuses on exploring the performance of CPU vector processing on mobile platforms, with the goal of addressing performance optimization challenges in resource-constrained mobile device environments.

提供机构：

密歇根大学

创建时间：

2023-09-06

搜集汇总

数据集介绍

构建方式

在移动计算领域，向量处理已成为提升能效与性能的关键技术。Swan数据集的构建源于对移动设备向量处理研究的需求，其构建过程系统而严谨。研究团队深入分析了四款广泛使用的移动应用源码，包括Chromium浏览器、Android操作系统、WebRTC音视频通信服务以及PDFium渲染引擎。通过精心筛选出12个共享库，从中提取了59个数据并行内核，每个内核执行独立任务，覆盖图像处理、音频处理、数据压缩、密码学等多个关键领域。为确保代表性，输入数据根据实际应用场景生成，如图像采用720x1280分辨率，音频采用44.1kHz采样率，并通过多次迭代确保测量稳定性。

特点

Swan数据集在移动向量处理基准测试中展现出独特优势。其核心特点在于全面覆盖移动应用的真实工作负载，从操作系统到多媒体处理，均体现了向量指令集的多样性。数据集不仅包含低精度图像处理内核，也涵盖浮点运算的音频与机器学习任务，同时支持Arm Neon的加密加速指令。每个内核均提供标量实现与显式向量化实现，便于对比分析。此外，Swan揭示了向量处理的典型计算模式，如归约、随机内存访问、跨步内存访问、矩阵转置等，为深入理解向量化瓶颈提供了丰富案例。数据集的开放性及其对性能、功耗、能量的多维度度量，进一步增强了其在架构研究与编译器优化中的实用价值。

使用方法

Swan数据集为移动向量处理的研究与评估提供了标准化平台。使用者可通过其开源代码库获取全部59个内核的实现，支持在Arm架构移动平台上进行编译与运行。在性能分析方面，数据集允许对比标量实现、编译器自动向量化实现以及显式向量化实现的差异，便于探究向量化收益与编译器局限。通过集成性能监控单元（PMU）事件分析，可深入剖析缓存行为、指令级并行度等微架构特征。对于扩展性研究，Swan提供模拟更宽向量寄存器与更多向量执行单元的方法，助力探索向量处理的伸缩潜力。此外，数据集支持与GPU等域特定加速器进行对比，有助于评估向量处理在细粒度并行任务中的优势。

背景与挑战

背景概述

Swan数据集由密歇根大学、庆应义塾大学及英伟达研究院的研究团队于2023年联合创建，旨在填补移动设备向量处理研究领域综合性基准测试套件的空白。该数据集聚焦于资源受限的移动平台，通过整合操作系统、网页浏览器、音视频通信应用及PDF渲染引擎等四大常用移动应用中的并行工作负载，系统评估向量化内核在性能、功耗及能耗方面的表现。其核心研究问题在于揭示移动设备中向量处理的优势与局限，为指令集架构、编译器优化及微架构设计提供实证依据，对移动计算与体系结构领域的学术与工业研究具有重要推动作用。

当前挑战

Swan数据集致力于解决移动设备中向量处理的效能评估挑战，具体包括：在领域问题层面，需应对向量化内核因高内存请求率导致的缓存层次压力加剧、低精度运算与高缓存命中率工作负载的收益差异，以及有限指令级并行与多维数据结构跨步访问对向量处理扩展性的制约。在构建过程中，挑战体现为从复杂移动应用源码中精确提取代表性数据并行内核、确保工作负载覆盖图像处理、音频编解码及机器学习等多领域指令多样性，并需克服编译器自动向量化在循环变换、数据依赖及启发式成本模型等方面的局限性，以保障基准测试的全面性与准确性。

常用场景

经典使用场景

在移动计算架构研究中，Swan数据集作为首个专注于移动设备向量处理的基准测试套件，其经典使用场景在于评估Arm Neon等向量指令集在资源受限移动平台上的性能与能效表现。该数据集通过整合来自操作系统、网页浏览器、音视频通信应用及PDF渲染引擎等四大常用移动应用的59个数据并行内核，为研究者提供了真实且多样化的移动工作负载，用于深入分析向量化内核在缓存层次压力、内存访问模式及指令级并行性等方面的微观架构行为。

衍生相关工作

Swan数据集的发布催生了多项延伸研究，包括基于RISC-V向量扩展（RVV）与Arm可扩展向量扩展（SVE）的移动向量化实现探索，以及针对Java向量API在Android应用中的性能分析工作。部分研究进一步将Swan的负载分析框架扩展至WebAssembly SIMD等新兴Web技术，评估向量化在移动浏览器引擎中的适用性。同时，该数据集为跨平台向量化编译优化、移动端域专用加速器（如GPU/DSP）与向量处理器的协同调度策略等研究提供了基准支撑，促进了移动异构计算生态的持续演进。

数据集最近研究