Matrix Dataset
收藏数据集概述
数据集名称
Memory-Augmented Agent Training for Business Document Understanding
数据集简介
该数据集与论文《Memory-Augmented Agent Training for Business Document Understanding》相关,旨在支持大型语言模型(LLM)代理在业务文档理解任务中的迭代学习和适应。数据集包含匿名的通用业务语言(UBL)发票文档,用于提取运输参考号的任务。
数据集特点
- 格式:XML文件,包含UBL发票文档,以及一个单独的
ground_truth.json文件,包含任务注释。 - 任务:从结构化业务文档中提取运输参考号。
- 匿名化:所有敏感标识符和结构化数据已被替换为假名或随机值。
数据集结构
data/ ├── ground_truth.json # 包含任务注释 ├── [UUID].xml # UBL发票文档
数据集贡献
- Matrix框架:一种新颖的范式,允许LLM代理通过内存优化迭代改进推理和任务性能。
- 开放数据集:首个公开的匿名化数据集,用于业务文档理解的基准测试。
- 性能提升:在运输参考号提取任务上,相比现有的LLM提示和代理系统,展示了30-35%的性能提升。
实验结果
- Chain-of-Thought Prompting:18.03% 成功率
- Reflexion:27.28% 成功率
- Matrix(提出方法):55.82% 成功率
效率提升
- 30.3%的改进:相比单一LLM提示方法。
- 减少延迟和减少API调用:使其在企业用例中更具成本效益。
- 改进长文档处理:可处理长达10,000个标记的文档。
许可证
该数据集采用MIT许可证。详细信息请参阅LICENSE文件。
引用
如果使用该数据集或框架,请引用以下论文: bibtext @misc{liu2024memoryaugmentedagenttrainingbusiness, title={Memory-Augmented Agent Training for Business Document Understanding}, author={Jiale Liu and Yifan Zeng and Malte Højmark-Bertelsen and Marie Normann Gadeberg and Huazheng Wang and Qingyun Wu}, year={2024}, eprint={2412.15274}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2412.15274}, }
联系方式
如有问题或疑问,请联系:
- Malte Højmark-Bertelsen: malte@beyondwork.ai




