FigureBench
收藏AutoFigure数据集概述
数据集基本信息
- 数据集名称: AutoFigure
- 关联基准数据集: FigureBench
- 发布日期: 未明确(关联研究发表于ICLR 2026)
- 许可证: MIT License
- 编程语言: Python 3.8+
- GitHub地址: https://github.com/ResearAI/AutoFigure
- 基准数据集HuggingFace地址: https://huggingface.co/datasets/WestlakeNLP/FigureBench
核心功能
- 文本到图表: 根据自然语言描述直接生成图表。
- 论文到图表: 从PDF中提取方法论并自动创建可视化图表。
- 迭代优化: 采用双智能体系统(生成+评估)进行持续质量优化。
- 多格式输出: 输出为SVG或mxGraph XML格式(完全兼容draw.io)。
- 图像增强: 可选的人工智能后处理,用于美学美化。
- Web界面: 交互式Next.js前端,便于生成和编辑。
基准数据集FigureBench详情
- 数据集目的: 首个用于从长文本生成科学插图的大规模基准。
- 数据总量: 3,300个样本
- 平均文本长度: 超过10,000个词元
- 平均文本密度: 41.2%
- 平均复杂度: 约5.3个组件
数据类别与统计
| 类别 | 样本数量 | 平均词元数 | 文本密度 | 复杂度 |
|---|---|---|---|---|
| 论文 | 3,200 | 12,732 | 42.1% | 高 |
| 博客 | 20 | 4,047 | 46.0% | 中 |
| 综述 | 40 | 2,179 | 43.8% | 高 |
| 教科书 | 40 | 352 | 25.0% | 低 |
使用方法
Python SDK安装
bash
基础安装
pip install autofigure
带PDF支持(用于论文到图表)
pip install autofigure[pdf]
带图像增强
pip install autofigure[enhancement]
完整安装(推荐)
pip install autofigure[full]
加载基准数据集
python from datasets import load_dataset dataset = load_dataset("WestlakeNLP/FigureBench")
基本生成示例(文本到图表)
python from autofigure import AutoFigureAgent, Config
config = Config( generation_api_key="your-api-key", generation_provider="openrouter", generation_model="google/gemini-2.5-pro", ) agent = AutoFigureAgent(config) result = agent.generate( description="A flowchart showing transformer training pipeline", max_iterations=5, output_format="svg", topic="paper" )
配置选项
支持的LLM提供商
- OpenRouter: 基础URL为
openrouter.ai/api/v1,推荐模型gemini-2.5-pro - Bianxie: 基础URL为
api.bianxie.ai/v1,推荐模型gemini-2.5-pro - Google: 基础URL为
generativelanguage...,推荐模型gemini-2.5-pro
关键生成设置
generation_api_key: 图表生成的API密钥(必需)generation_model: 模型名称(默认为提供商默认值)generation_provider: 提供商:openrouter、bianxie、gemini(默认为openrouter)max_iterations: 最大优化迭代次数(默认为5)quality_threshold: 质量阈值(0-10)(默认为9.0)
输出结果
success: 生成是否成功svg_path: 生成的SVG文件路径mxgraph_path: 生成的mxGraph XML文件路径preview_path: PNG预览图像路径enhanced_paths: 所有增强图像路径列表final_score: 最终质量评分(0-10)methodology_text: 提取的方法论文本(来自论文)
引用格式
bibtex @inproceedings{ zhu2026autofigure, title={AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations}, author={Minjun Zhu and Zhen Lin and Yixuan Weng and Panzhong Lu and Qiujie Xie and Yifan Wei and Sifan Liu and Qiyao Sun and Yue Zhang}, booktitle={The Fourteenth International Conference on Learning Representations}, year={2026}, url={https://openreview.net/forum?id=5N3z9JQJKq} }




