Herculean
收藏Herculean: 金融智能体评估基准数据集
数据集概述
Herculean 是一个用于评估 LLM 智能体在五项金融分析任务中表现的离线基准数据集。所有任务均基于完全离线数据运行,确保结果可复现且在不同模型间可比。
数据集规模
- 总样本量:1,000 < n < 10,000
- 数据覆盖:8只美国 mega-cap 科技股(AAPL, ADBE, AMZN, GOOGL, META, MSFT, NVDA, TSLA)
- 时间范围:2024-12-01 → 2026-03-31(约16个月)
数据集组成
1. 核心数据库(env.duckdb)
| 数据表 | 行数 | 列数 | 描述 |
|---|---|---|---|
| prices | 2,656 | 9 | 日度OHLC价格、调整收盘价、成交量(符号、日期、开盘、最高、最低、收盘、调整收盘、成交量) |
| news | 3,888 | 4 | 每日新闻摘要(符号、日期、摘要内容) |
| filings | 73 | 6 | 10-K/10-Q财报文本(符号、日期、文件类型、MD&A内容、风险内容) |
2. Parquet 格式数据(data/)
提供与 DuckDB 表完全一致的 Parquet 文件(ZSTD压缩),支持通过 Hugging Face Datasets 直接加载。
3. 审计数据(auditing_env/)
- 158份SEC XBRL文件(10-K和10-Q,2021–2023财年)
- 每份文件包含:XBRL实例文档、计算/定义/标签/展示链接库
- US-GAAP分类标准分块(2021–2024年)
- 每年约20k概念块、50k关系边
- 4,959条数学一致性断言(mathematical_reasoning.csv)
评估任务
数据集支持五项金融分析任务:
- 交易(Trading)
- 对冲(Hedging)
- 报告生成(Report Generation)
- 报告评估(Report Evaluation)
- XBRL文件审计(XBRL Filing Auditing)
数据来源与预处理
- 价格数据:来源于公开的日度OHLCV数据
- 新闻摘要:LLM生成的每日摘要(基于公开事件)
- 财报文本:从SEC EDGAR 10-K/10-Q文件中提取
- XBRL文件:直接从SEC EDGAR下载,保持字节一致
- 分类标准:来自FASB官方US-GAAP财务报告分类标准
数据加载方式
通过 Hugging Face Datasets(Parquet格式): python from datasets import load_dataset prices = load_dataset("TheFinAI/Herculean", "prices", split="train") news = load_dataset("TheFinAI/Herculean", "news", split="train") filings = load_dataset("TheFinAI/Herculean", "filings", split="train")
通过 DuckDB(单文件): python import duckdb con = duckdb.connect("env.duckdb", read_only=True) con.execute("SELECT symbol, date, close FROM prices WHERE symbol=TSLA ORDER BY date").df()
预期用途
- 基准测试LLM智能体在多日、工具使用的金融任务中的表现
- 审计XBRL数值事实
- 研究智能体推理质量
使用限制
- 非用于实盘交易
- 非预测性基准
- 非投资建议语料库
已知局限性
- 仅覆盖8只mega-cap科技股(行业和市值偏倚严重)
- 时间窗口短(仅约16个月)
- 新闻字段为LLM摘要(可能继承摘要器偏差)
- 财报文本仅含MD&A和风险因素部分
- XBRL样本偏向于被DQC规则标记的文件
偏见与风险
- 存在幸存者/大市值偏倚
- 仅含英语、US-GAAP、美国发行人数据
- 数据截止至2026-03-31
- 不含个人身份信息
许可证
- 数据:CC BY 4.0
- SEC XBRL文件:美国联邦政府公共领域内容
- US-GAAP分类标准:FASB免费使用
引用
bibtex @misc{herculean_2026, title = {Herculean: An Offline Multi-Skill Evaluation Benchmark for LLM Agents in Finance}, author = {Peng, Xueqing}, year = {2026}, url = {https://huggingface.co/datasets/TheFinAI/Herculean} }




