BizBench
收藏arXiv2024-03-13 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2311.06602v2
下载链接
链接失效反馈官方服务:
资源简介:
BizBench是由Kensho Technologies开发的一个量化推理基准,专注于商业和金融领域。该数据集包含八个任务,旨在评估模型在领域知识、数量提取和程序合成方面的能力。这些任务包括从财务数据中进行问答(QA)的程序合成,以及对财务文本和表格的阅读理解,以提取中间值和理解财务概念及公式以计算复杂解决方案。BizBench通过这些任务评估模型的财务背景知识、解析财务文档的能力以及使用代码解决问题的能力。
提供机构:
Kensho Technologies
创建时间:
2023-11-12
搜集汇总
数据集介绍

背景与挑战
背景概述
BizBench是一个由Kensho Technologies开发的量化推理基准,专注于商业和金融领域,包含八个任务,旨在评估模型在领域知识、数量提取和程序合成方面的能力。它通过财务数据问答、文本表格阅读理解等任务,测试模型的财务背景知识、文档解析和代码解决能力,适用于评估模型在金融场景下的综合推理性能。
以上内容由遇见数据集搜集并总结生成



