FormFactory
收藏FormFactory 数据集概述
📌 数据集简介
FormFactory 是一个用于多模态表单填写代理的交互式基准测试套件,专注于解决在线表单填写任务中的布局理解和字段-值对齐问题。
🌐 数据组成
-
Web 前端
- 包含 40+ 高保真 HTML 表单,覆盖 8 个真实场景领域:
- 学术界、商业、金融、医疗保健、艺术、技术、法律、制造业
- 包含 40+ 高保真 HTML 表单,覆盖 8 个真实场景领域:
-
数据集
data1/:每个表单的 JSON 格式黄金答案(真实字段值)data2/:支持性文本材料(可用作额外上下文或提示)labeled-images/:页面截图和对应的边界框标注(按文件夹 A-H 组织)
-
后端服务
- 轻量级 Flask API,功能包括:
- 页面渲染
- 提交接收
- 结果自动保存
- 轻量级 Flask API,功能包括:
-
评估脚本
- 提供多种评估工具:
- 字段级和表单级准确率计算
- 布局推理指标等
- 提供多种评估工具:
✨ 核心特点
- 多领域覆盖:8 个不同应用领域
- 高保真页面:真实布局测试视觉理解和字段定位能力
- 动态字段:包含组、可重复部分、级联依赖等复杂字段
- 交互式评估:实时观察模型行为并自动保存结果
- 易于扩展:只需提供 HTML 模板和 JSON 答案文件即可添加新表单
📂 目录结构
text formfactory/ ├─ app.py # Flask 后端入口 ├─ templates/ # 40+ HTML 表单模板 ├─ static/ # 样式表和前端资源 ├─ data/ # 数据集根目录 │ ├─ data1/ # JSON 格式黄金答案 │ ├─ data2/ # 支持性文本材料 │ └─ labeled-images/ # 截图+边界框标注 (A–H) ├─ submission/ # 自动生成的用户/模型提交 └─ README.md # 说明文档
📄 许可信息
- 项目采用 MIT 许可证
- 许可证文件:https://github.com/formfactory-ai/formfactory/blob/main/LICENSE
🔗 引用方式
bibtex @misc{li2025formfactoryinteractivebenchmarkingsuite, title = {FormFactory: An Interactive Benchmarking Suite for Multimodal Form-Filling Agents}, author = {Bobo Li and Yuheng Wang and Hao Fei and Juncheng Li and Wei Ji and Mong-Li Lee and Wynne Hsu}, year = {2025}, eprint = {2506.01520}, archivePrefix= {arXiv}, primaryClass = {cs.CL}, url = {https://arxiv.org/abs/2506.01520} }




