five

investment-banking

收藏
Hugging Face2026-02-25 更新2026-02-26 收录
下载链接:
https://huggingface.co/datasets/playgent-hf/investment-banking
下载链接
链接失效反馈
官方服务:
资源简介:
Playgent-IB-Bench 是一个用于评估AI代理在现实世界投资银行任务上表现的基准数据集。每个任务将代理置于模拟的交易环境中(包含金融文档、Excel模板和支持数据的ZIP存档),并要求其完成分析师级别的工作产品。数据集包含40个任务,每个任务配有提示和世界分配。验证器目录包含按任务分级的验证检查,世界目录则包含交易环境的ZIP存档。数据集适用于投资银行、强化学习、代理、金融、评估和基准测试等场景。数据集规模为小于1K,语言为英语,许可证为MIT。
创建时间:
2026-02-19
搜集汇总
数据集介绍
main_image_url
构建方式
在投资银行领域,数据集的构建需高度模拟真实交易环境。Playgent-IB-Bench通过精心设计的模拟交易场景,将每个任务封装为独立的ZIP归档,其中包含财务文档、Excel模板及辅助数据,以还原分析师在并购、资产剥离等实际业务中的工作流程。该数据集涵盖40项任务,涉及买方并购、卖方流程及杠杆收购等多种情境,任务提示与世界分配均以结构化JSONL格式组织,确保了评估的严谨性与可重复性。
特点
该数据集的核心特征在于其高度仿真的任务设计,每个任务均嵌入具体的交易环境,要求智能体处理电子表格建模与财务分析等专业工作。验证机制采用双轨制:一方面通过电子表格单元格数值的精确比对,辅以容差控制来评估计算准确性;另一方面借助大型语言模型进行语义判断,以检验结构合规性与行业惯例遵循度。奖励设置包含正负分值,能够有效识别常见错误,从而提供多维度的性能度量。
使用方法
使用该数据集时,推荐通过Prime Intellect平台部署强化学习环境,以实现任务执行与评估的自动化流程。若采用本地手动方法,可通过加载JSONL文件解析任务提示,并依据任务标识符调用对应的验证器文件。验证器定义了具体的检查规则,包括电子表格单元格取值或基于大型语言模型的评判准则。用户需将智能体输出与验证标准进行比对,从而系统性地评估其在投资银行任务中的表现。
背景与挑战
背景概述
随着人工智能在金融领域的深入应用,投资银行业务的自动化与智能化成为前沿研究方向。Playgent-IB-Bench数据集由Playgent团队于2025年发布,旨在构建一个针对真实世界投资银行任务的评估基准。该数据集聚焦于模拟交易环境,涵盖并购、资产剥离、卖方流程及杠杆收购等多种场景,通过提供包含财务文档、Excel模板及支持数据的压缩档案,要求智能体完成分析师级别的工作产出。其核心研究问题在于如何系统评估强化学习智能体在复杂金融建模与电子表格操作中的实际表现,为金融人工智能的可靠性与实用性设定了新的标准,对推动自动化投行工具的发展具有显著影响力。
当前挑战
该数据集致力于解决投资银行领域任务自动化的核心挑战,即如何准确评估智能体在多变且高风险的金融交易环境中的决策与执行能力。具体挑战包括:智能体需处理非结构化的财务文档,进行精确的数值计算与电子表格操作,同时遵循严格的金融建模规范;在构建过程中,团队面临整合多样化真实交易数据、设计可扩展的验证机制以及确保任务环境仿真的真实性等难题。这些挑战共同指向了金融人工智能在可靠性、可解释性与适应性方面的深层需求。
常用场景
经典使用场景
在金融科技与人工智能交叉领域,Playgent-IB-Bench数据集为评估AI代理在真实投资银行任务中的表现提供了标准化测试环境。该数据集通过模拟并购、资产剥离、卖方流程等典型交易场景,要求代理基于提供的财务文档、Excel模板及支持数据,完成分析师级别的金融建模与报告生成工作,从而系统检验代理在复杂金融环境下的任务执行能力。
实际应用
在实际金融业务中,该数据集可直接应用于投资银行分析师工作流程的自动化开发与优化。金融机构与技术公司可借助其模拟的交易环境,训练和测试AI代理执行财务分析、估值建模、交易文件生成等重复性高、精度要求严苛的任务,从而提升运营效率、降低人为错误,并为智能投行助手等实际产品的研发提供核心验证平台。
衍生相关工作
围绕该数据集,已衍生出一系列专注于金融领域智能体能力评估的经典研究工作。这些工作通常集中于改进代理在电子表格操作、多文档信息整合与金融逻辑推理等方面的算法,例如基于强化学习的任务分解策略、结合领域知识的验证器设计,以及跨场景迁移学习框架的构建,显著丰富了AI在专业垂直领域的应用探索。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作