DeepFund

Name: DeepFund
Creator: 香港科技大学（广州）
Published: 2025-05-16 18:00:56
License: 暂无描述

arXiv2025-05-16 更新2025-05-20 收录

下载链接：

https://github.com/HKUSTDial/DeepFund

下载链接

链接失效反馈

官方服务：

资源简介：

DeepFund是一个实时的基金投资基准工具，旨在严格评估大型语言模型（LLMs）在实时市场条件下的表现。它通过多代理架构直接连接实时股市数据，以确保公平且无信息泄露的评估。DeepFund的数据集来源于实时股市数据、基金资产信息以及交易历史，旨在解决现有基准测试在评估LLMs驱动的交易策略时存在的依赖历史回测、可能的信息泄露和过度乐观的性能估计等问题。

DeepFund is a real-time fund investment benchmark tool designed to rigorously evaluate the performance of large language models (LLMs) under real-time market conditions. It adopts a multi-agent architecture to directly connect with real-time stock market data, ensuring fair and information-leak-free evaluations. The dataset of DeepFund is sourced from real-time stock market data, fund asset information and transaction history, aiming to address the issues of existing benchmarks when evaluating LLM-driven trading strategies, including reliance on historical backtesting, potential information leakage and overly optimistic performance estimates.

提供机构：

香港科技大学（广州）

创建时间：

2025-05-16

搜集汇总

数据集介绍

构建方式

DeepFund数据集的构建采用了多智能体架构，通过直接连接实时股票市场数据，确保评估过程无信息泄漏。数据集的设计灵感来源于先前的研究，通过实时交易条件支持前瞻性测试，并提供了一个基于Web的交互界面，用于性能可视化和特定领域金融指标的对比分析。数据集成模块化的API网关，与多个金融数据提供商（如Yahoo Finance和Alpha Vantage）对接，确保数据的多样性和市场环境的真实性。

使用方法

DeepFund数据集的使用方法主要包括实时市场环境下的模型评估和多智能体决策流程的模拟。用户可以通过交互式Web界面查看和分析不同LLM在实时交易中的表现，包括投资决策、投资组合管理和风险控制等方面。数据集支持灵活的配置，用户可以选择不同的LLM作为智能体的后端，并通过标准化的提示和温度设置确保评估的公平性。此外，数据集还提供了详细的交易历史和信号数据，便于用户进行深入的分析和研究。

背景与挑战

背景概述

DeepFund是由香港科技大学（广州）的研究团队于2025年推出的实时基金投资基准测试工具，旨在解决大型语言模型（LLMs）在金融投资领域评估中的关键缺陷。传统基准测试依赖历史回测，导致LLMs可能利用训练数据中的未来信息（即“时间旅行”问题），从而产生信息泄露和过于乐观的性能估计。DeepFund通过多智能体架构直接连接实时股市数据，确保评估的公平性和无信息泄露。该数据集的推出标志着金融AI评估从静态测试向动态实时交互的重要转变，为LLMs在实时市场条件下的投资决策能力提供了首个标准化评估框架。

当前挑战

DeepFund面临的挑战主要体现在两个方面：领域问题挑战方面，实时金融决策需要处理高噪声、非平稳的市场数据，且不同LLMs的知识截止日期差异导致跨模型公平比较困难；构建过程挑战方面，实时数据流的低延迟同步、多源异构金融数据的标准化整合、以及避免评估期间模型微调带来的数据污染等问题都增加了系统构建复杂度。此外，如何设计具有足够泛化能力的评估指标来捕捉LLMs在股票分析、投资决策、组合管理和风险控制等多维度的表现，也是该数据集需要持续优化的关键挑战。

常用场景

经典使用场景

DeepFund数据集在金融人工智能领域中被广泛用于实时基金投资基准测试。其多智能体架构和实时市场数据连接能力，为评估大型语言模型（LLMs）在复杂投资决策中的表现提供了标准化平台。研究者通过模拟真实市场环境，测试LLMs在股票代码分析、投资决策、资产组合管理和风险控制等多个维度的能力。

解决学术问题

DeepFund解决了金融AI领域中长期存在的‘时间旅行’问题，即LLMs在历史回测中可能利用训练数据中的未来信息导致性能虚高。通过实时市场数据连接和严格的预训练截止日期控制，该数据集确保了无信息泄漏的公平评估，为LLMs在真实金融场景中的能力提供了可靠测量标准。

实际应用

在实际应用中，DeepFund为金融机构提供了评估AI投资策略有效性的工具。其多智能体框架模拟了专业基金团队的工作流程，包括财务规划师、分析师团队和投资组合经理等角色，使机构能够测试不同LLMs在真实市场条件下的决策能力，优化AI驱动的投资系统。

数据集最近研究