DSE dataset
收藏AIrchitect-v2 数据集概述
数据集简介
AIrchitect-v2 数据集用于在 MAESTRO 模型加速器上进行硬件资源分配的探索。数据集包含 100k 条记录,位于 ./dse_dataset 目录下,无需额外下载。数据集包含两个文件:gemm_dataset_*.csv 提供基于 GEMM 工作负载的 DSE 输入,conv_dataset_*.csv 提供基于卷积工作负载的 DSE 输入。
数据集结构
输入列
- GEMM 工作负载:
[M, N, GEMM_K, df] - 卷积工作负载:
[K, C, X, Y, R, S, df]K、C、X、Y、R、S:卷积维度df:数据流风格,取值为dla、eye、shi
输出列
- ConfigID:最优硬件配置(
#PE、Buffer Size)#PE范围为[1,64],Buffer Size范围为[1,12]ConfigID = #PE * max(Buffer Size) + Buffer Size
- rewards:DSE 的性能值,本工作中设置为延迟
数据集使用
- 自定义数据支持:可通过修改
dataset.py文件来支持自定义 DSE 数据。 - 模型训练:数据集可用于训练模型,预测
ConfigID或分解为#PE和Buffer Size进行训练。
运行指令
-
第一阶段编码器训练: bash python3 main.py --data ./dse_dataset/conv_dataset_100k.csv --model Transformer --enable_surrogate --alpha 0.2 --save
-
第二阶段解码器 + UOV 训练: bash python3 main_linear.py --data ./dse_dataset/conv_dataset_100k.csv --model Transformer --enable_surrogate --classifier Transformer --load_chkpt <path-to-stage1-model> [--ordinal] [--interval]
预训练模型
pretrained_models/stage1_encoder.pthpretrained_models/stage2_decoder.pth
引用
如果使用该数据集或相关成果,请引用以下文献: bibtex @article{ramachandran2025uov, title={AIrchitect v2: Learning the Hardware Accelerator Design Space through Unified Representations}, author={Ramachandran, Akshat and Seo, Jamin and Chuang, Yu-Chuan and Itagi, Anirudh and Krishna, Tushar}, booktitle={2025 Design, Automation & Test in Europe Conference & Exhibition (DATE)}, pages={1--7}, year={2025}, organization={IEEE} }
参考文献
- Kwon, H., Chatarasi, P., Sarkar, V., Krishna, T., Pellauer, M., & Parashar, A. (2020). MAESTRO: A data-centric approach to understand reuse, performance, and hardware cost of DNN mappings. IEEE Micro, 40(3), 20-29.
- Kao, S.-C., Jeong, G., & Krishna, T. (2020). Confuciux: Autonomous hardware resource assignment for dnn accelerators using reinforcement learning. In 2020 53rd Annual IEEE/ACM International Symposium on Microarchitecture (MICRO) (pp. 622-636).




