AesCoder-4B
收藏arXiv2025-10-27 更新2025-11-04 收录
下载链接:
https://hf-mirror.com/SamuelBang/AesCoder-4B
下载链接
链接失效反馈官方服务:
资源简介:
AesCoder-4B 是一个专注于代码美学的大规模指令微调数据集,旨在提升大语言模型在可视化与审美相关的代码生成能力。数据涵盖配色、布局、样式与交互等多维度美学优化示例,结合审美反馈机制训练后,可显著改善模型生成代码的美观性与表现力,为审美代码生成模型提供高质量训练基础。
AesCoder-4B is a large-scale instruction fine-tuning dataset focused on code aesthetics, aiming to enhance the code generation capabilities of large language models (LLMs) in visualization and aesthetic-related tasks. The dataset covers multi-dimensional aesthetic optimization examples including color matching, layout, styling, and interaction. After training with an aesthetic feedback mechanism, it can significantly improve the aesthetic quality and expressive power of the code generated by the models, providing a high-quality training foundation for aesthetic code generation models.
提供机构:
微软亚洲研究院
创建时间:
2025-10-27
搜集汇总
数据集介绍

构建方式
在视觉导向编程任务日益重要的背景下,AesCode-358K数据集通过系统化流程构建而成。该数据集聚焦Python绘图生成与网页设计两大核心领域,首先从现有VisCode-200K数据集中筛选指令,利用先进的大语言模型重新生成Python代码,并通过Jupyter Notebook运行时验证确保代码可执行性。针对网页设计数据,采用四阶段构建方法:基于GPT-4o生成种子关键词库,通过语义嵌入空间分析和t-SNE可视化进行类别去重叠处理,应用大规模聚类保留代表性样本,最终通过多模型协同生成高质量HTML代码并经过渲染验证。
特点
该数据集展现出显著的多维度特征优势。其规模达到358K指令调优样本,覆盖Python绘图与网页设计两大视觉编程领域,具备任务多样性特点。数据质量经过严格把控,通过可执行性验证和视觉渲染评估双重筛选机制,确保每个样本都达到工业级标准。特别值得关注的是其美学导向特性,数据集专门针对代码执行结果的视觉美感进行优化,解决了传统代码数据集忽视美学维度的问题。此外,数据集还展现出良好的类别平衡性,通过语义分析和聚类技术有效消除了类别重叠现象。
使用方法
该数据集的应用遵循分阶段优化策略。研究者首先在AesCode-358K上进行监督微调,建立模型的基础美学编码能力。随后进入强化学习阶段,采用GRPO-AR算法结合多智能体奖励框架进行联合优化。具体实施时,执行智能体验证代码可执行性,静态美学智能体基于网页截图评估视觉质量,交互美学智能体通过自主导航探索网页交互功能。三个智能体的反馈通过加权聚合形成综合奖励信号,指导模型在保持功能正确性的同时提升美学表现。这种多模态评估机制确保了模型输出的网页既具备视觉吸引力,又保证良好的用户体验。
背景与挑战
背景概述
随着大语言模型在代码生成领域的广泛应用,其在视觉导向编程任务中的美学质量成为新兴研究焦点。微软亚洲研究院于2025年提出AesCoder-4B数据集,旨在解决代码生成模型在图表绘制与网页设计等任务中存在的视觉元素重叠、色彩失调等美学缺陷。该数据集通过构建包含35.8万条指令的大规模监督微调数据,首次系统性地定义了代码美学概念,推动了编程智能从功能正确性到视觉表现力的范式转变。
当前挑战
该数据集面临的领域挑战在于突破传统代码评估仅关注执行正确性的局限,需建立融合视觉审美与交互体验的多维度评估体系。构建过程中需攻克三大技术难题:网页设计数据的语义去重与质量筛选、静态美学与交互美学的量化评估、以及多智能体奖励反馈系统的协同优化。这些挑战要求同时保证生成代码的功能完备性、视觉协调性与交互流畅性,对现有代码生成模型的跨模态理解能力提出更高要求。
常用场景
经典使用场景
在视觉导向编程任务中,AesCoder-4B数据集通过其大规模指令调优数据,显著提升了语言模型生成代码的美学质量。该数据集特别适用于Python绘图生成与网页设计两大核心领域,通过多维度评估机制优化代码的可执行性、静态视觉效果及交互体验,为模型训练提供了全面的美学对齐基准。
实际应用
在实际开发场景中,该数据集赋能自动化网页设计与数据可视化工具,显著提升用户界面美观度与交互流畅性。企业可基于其训练模型快速生成符合品牌调性的响应式网页,教育机构能构建具有视觉吸引力的交互式教学平台,有效降低高质量前端开发的成本与门槛。
衍生相关工作
该数据集催生了OpenDesign基准测试体系与GRPO-AR强化学习算法等创新成果。其多智能体评估框架为后续研究提供了可扩展的奖励机制设计范式,启发了一系列基于视觉反馈的代码优化工作,包括动态界面渲染评估、跨平台兼容性测试等衍生研究方向。
以上内容由遇见数据集搜集并总结生成



