SchemaBench
收藏Schema Reinforcement Learning 数据集概述
数据集基本信息
- 名称: SchemaBench
- 用途: 仅供研究和教育用途
- 数据来源:
- JSON Schema Store (https://www.schemastore.org/json/)
- GitHub
- 数据规模: 40K+ 真实世界模式文件
数据内容
-
文件结构:
├── /schemabench/ │ └── /data/ │ ├── /custom/ // 自定义格式 │ ├── /schema/ // 复杂模式 │ ├── custom_append.jsonl │ └── translation_test.jsonl // 转义翻译 ├── /train/ │ └── /data/ │ ├── mix_train_no_collected_json.json // SFT - 无收集的JSON │ ├── mix_train.json // SFT - 有收集的JSON │ ├── train_with_tool_ToS.parquet // SRL - 训练集 │ └── val_with_tool_ToS.parquet // SRL - 验证集
数据下载
- 下载链接:
- Google Drive: https://drive.google.com/drive/folders/1NOx6xzS30HHRk5rikUdNOXvOT7UtwstR
- 清华云: https://cloud.tsinghua.edu.cn/d/732f121b7b0044798190/
模型性能
-
评估指标:
- 模式生成 (Schema-only Generation)
- 复杂模式 (Complex)
- 自定义格式 (Custom)
- 转义 (Escape)
- 总体 (Overall)
- 模式约束推理 (Schema-constrained Reasoning)
- GSM8K
- MATH500
- MMLU
- ARC-C
- 模式生成 (Schema-only Generation)
-
性能表现:
- LLaMA-3.2 3B SRL:
- 复杂模式: 82.25
- 自定义格式: 66.13
- 转义: 69.10
- 总体: 72.50
- GSM8K: 84.23
- MATH500: 43.20
- MMLU: 57.99
- ARC-C: 78.24
- LLaMA-3.2 3B SRL:
训练与评估
-
训练步骤:
- 环境初始化 (python==3.11)
- 数据准备
- 微调 (Fine-Tuning)
- 模式强化学习 (Schema Reinforcement Learning, SRL)
-
评估步骤:
- 初始化配置文件
- 运行评估脚本
引用
bibtex @misc{lu2025learninggeneratestructuredoutput, title={Learning to Generate Structured Output with Schema Reinforcement Learning}, author={Yaxi Lu and Haolun Li and Xin Cong and Zhong Zhang and Yesai Wu and Yankai Lin and Zhiyuan Liu and Fangming Liu and Maosong Sun}, year={2025}, eprint={2502.18878}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2502.18878}, }




