LEMUR Neural Network Dataset
收藏arXiv2025-04-14 更新2025-04-10 收录
下载链接:
https://github.com/ABrain-One/nn-dataset
下载链接
链接失效反馈官方服务:
资源简介:
LEMUR是一个开源的神经网络模型数据集,由德国维尔茨堡大学计算机视觉实验室CAIDAS提供。该数据集包含经过严格测试的神经网络实现,适用于各种任务,如对象检测、图像分类、分割和自然语言处理等,旨在支持自动机器学习(AutoML)任务的微调大型语言模型(LLMs)。LEMUR利用Python和PyTorch,能够无缝扩展到新的数据集和模型,同时保持一致性。它集成了Optuna驱动的框架,用于评估、超参数优化、统计分析以及图形化洞察。LEMUR还提供了一个扩展,使模型能够高效地在边缘设备上运行,便于在资源受限的环境中部署。该数据集提供了用于模型评估、预处理和数据库管理的工具,支持研究者和实践者在开发、测试和分析神经网络时使用。
LEMUR is an open-source neural network model dataset provided by the CAIDAS Computer Vision Laboratory at the University of Würzburg, Germany. This dataset contains rigorously tested neural network implementations suitable for a wide range of tasks including object detection, image classification, segmentation, natural language processing and more, aiming to support fine-tuning of large language models (LLMs) for automated machine learning (AutoML) tasks. Built on Python and PyTorch, LEMUR enables seamless scaling to new datasets and models while maintaining consistency. It integrates an Optuna-driven framework for evaluation, hyperparameter optimization, statistical analysis and graphical insights. LEMUR also provides an extension that enables efficient model execution on edge devices, facilitating deployment in resource-constrained environments. The dataset offers tools for model evaluation, preprocessing and database management, supporting researchers and practitioners in developing, testing and analyzing neural networks.
提供机构:
德国维尔茨堡大学计算机视觉实验室CAIDAS
创建时间:
2025-04-14
搜集汇总
数据集介绍

构建方式
LEMUR Neural Network (NN) Dataset的构建采用了基于大语言模型(LLMs)的超参数优化方法。具体而言,研究团队通过参数高效的LoRA微调技术,对Code Llama模型进行优化,使其能够针对不同的神经网络架构生成精确且高效的超参数推荐。数据集的构建过程包括使用Optuna框架对17种计算机视觉和文本生成模型进行超参数调优,记录每种超参数配置下的模型性能,最终形成一个包含3700个超参数-精度对的公开数据集。在后续的微调循环中,数据集进一步扩充至7107个条目,增强了模型的统计表示能力。
特点
LEMUR NN Dataset的核心特点在于其创新性地利用微调后的大语言模型进行超参数优化,显著降低了传统方法如贝叶斯优化或进化策略所需的高计算成本。数据集覆盖了多种主流神经网络架构(如ResNet、DenseNet、LSTM等),并包含学习率、批量大小和动量等关键超参数在不同训练周期下的性能表现。特别值得注意的是,该数据集展示了LLMs在单次推理中生成超参数的能力,使其特别适合计算资源受限的边缘设备应用场景。此外,数据集通过严格的验证流程确保超参数建议的质量,为超参数优化研究提供了可靠的基准。
使用方法
使用LEMUR NN Dataset时,研究人员可通过加载预生成的JSON格式数据,快速获取针对特定神经网络架构的优化超参数配置。数据集支持两种主要应用方式:一是直接采用已验证的超参数组合进行模型训练,显著减少调参时间;二是作为训练数据用于进一步微调大语言模型,以扩展其超参数优化能力。对于需要定制化解决方案的用户,可参考论文中的提示模板(如Listing 1所示),将目标模型的架构描述和预期精度要求输入微调后的Code Llama模型,即可获得定制化的超参数推荐。数据集的GitHub开源特性还允许用户贡献新的超参数-性能数据,持续扩展其覆盖范围。
背景与挑战
背景概述
LEMUR Neural Network (NN) Dataset由德国维尔茨堡大学计算机视觉实验室的研究团队于2025年创建,旨在探索大型语言模型(LLMs)在神经网络超参数优化中的潜力。该数据集的核心研究问题聚焦于如何利用经过微调的Code Llama模型,替代传统的超参数优化方法(如Optuna),以更高效地生成适用于多样化神经网络架构的超参数配置。研究团队通过参数高效的LoRA微调技术,使LLMs能够根据历史调优数据生成精准的超参数建议,显著降低了计算开销。这一创新不仅挑战了基于贝叶斯优化和进化策略的传统范式,还为边缘设备等资源受限环境提供了可行的解决方案。数据集作为开源基准在GitHub发布,推动了自动化机器学习(AutoML)领域对LLM驱动优化的深入研究。
当前挑战
LEMUR NN Dataset面临的挑战主要体现在两个维度:领域问题层面,超参数优化本身存在高维搜索空间带来的组合爆炸问题,传统方法如网格搜索在模型复杂度增加时计算成本呈指数级增长,而贝叶斯优化等先进方法仍受限于迭代评估的固有缺陷;构建过程层面,研究团队需解决三大技术难题——如何设计有效的提示工程使Code Llama理解超参数优化的语义约束,如何通过有限的历史调优数据确保LLM生成参数的泛化能力,以及如何平衡LoRA微调的效率与模型预测精度。特别在跨架构迁移方面,数据集中包含的视觉Transformer等新兴模型暴露出LLM对未见架构的适应性问题,这要求微调策略必须捕捉不同神经网络层的共性特征。
常用场景
经典使用场景
在深度学习模型优化领域,LEMUR NN数据集为超参数调优研究提供了标准化基准。该数据集通过整合Optuna框架生成的超参数-性能配对数据,特别适用于比较传统优化方法与新兴大语言模型(如Code Llama)在计算机视觉模型(如ResNet、ConvNeXt)和文本生成模型(如LLaMA)上的调优效果。研究者可通过该数据集验证LLM在单次推理中预测超参数的可行性,替代传统耗时的网格搜索或贝叶斯优化。
实际应用
LEMUR数据集的实际价值在自动化机器学习(AutoML)管道中尤为突出。工业界可基于该数据集预训练的Code Llama模型,快速为图像分类系统(如医疗影像分析)或文本生成服务(如智能客服)部署最优超参数配置。在移动端AI应用中,数据集提供的轻量级调优方案能使手机端模型训练效率提升3倍以上。此外,数据集涵盖的17种模型架构和7107组参数组合,为MLOps平台构建超参数推荐系统提供了丰富的训练样本。
衍生相关工作
该数据集直接催生了三项标志性研究:LLAMBO将Code Llama与贝叶斯优化结合实现零样本热启动,在NeurIPS 2024展示显著加速效果;微软开发的AgentHPO利用该数据集训练出可解释性更强的超参数优化代理;后续研究SLLMBO则基于此提出序列化LLM优化框架,在TPU集群上实现比传统BO高40%的采样效率。这些衍生工作共同推动了'LLM as Optimizer'新范式在AutoML领域的发展。
以上内容由遇见数据集搜集并总结生成



