MacroLens
收藏MacroLens 数据集概述
基本信息
- 许可证: CC-BY-4.0
- 语言: 英语
- 数据规模: 1M < n < 10M
- 任务类型: 时间序列预测、表格回归、文本生成、问答
- 标签: 金融、宏观经济、多模态、基准测试、SEC EDGAR、XBRL、RentCast、小盘股、罗素2000、私人估值、情景条件预测
数据集描述
MacroLens 是一个面向宏观经济情景下的上下文金融推理的多任务基准数据集,覆盖 4,416 只美国小型和微型股票(时间跨度:2021-01-04 至 2026-03-31)。该数据集在单一时间点面板上统一了七个任务。
七项任务
| 任务 | 类型 | 输出 |
|---|---|---|
| T1 上下文预测 | 时间序列 | 预测区间收盘价轨迹 |
| T2 公开估值 | 表格回归 | 股权市值 |
| T3 财务报表生成 | 结构化生成 | 每个(股票代码,财年)的11个XBRL标准字段 |
| T4 情景条件收益预测 | 事件预测 | 63天后的事件后收益百分比 |
| T5 私人公司估值 | 表格回归(去价格化) | 无市场数据的股权价值 |
| T6 生成器评估 | 自然语言→结构化 | 从公司自然语言描述生成相同的11个字段 |
| T7 房地产估值 | 跨域回归 | 基于RentCast地址的租金+价格 |
数据特征
每个实例包含:
- 131个数值/141列的时间点面板(价格、4680万XBRL会计事实、53个宏观经济序列、提交时效、衍生比率)
- 可选的宏观经济情景对象(49种类型共1,130个事件)
- 可选的SEC文件和金融新闻上下文
- 时间对齐严格遵循“时间点原则”:预测时间戳 t 处可见的每个观察值在 t 之前已公开可用
数据集结构
data/ ├── daily/ # 主粒度(484万面板行) │ ├── panel_train.parquet # T1, T4 训练集 │ ├── panel_test.parquet # T1, T4 测试集 │ ├── scenarios.parquet # 1,130个宏观经济事件 │ ├── valuation_inputs.parquet # T2 特征+真实值 │ ├── private_valuation_inputs.parquet # T5(去价格化) │ ├── generation_inputs.parquet # T3 基本面快照 │ ├── generation_ground_truth.parquet # T3 长格式(股票代码,财年,字段,值) │ ├── generator_eval_inputs.parquet # T6 自然语言公司描述 │ ├── generator_eval_ground_truth.parquet │ └── scenario_forecast_ground_truth.parquet # T4 真实值 ├── weekly/ # 周五收盘重采样(101万行) ├── monthly/ # 最后一个交易日重采样(23.2万行) ├── real_estate/ │ ├── re_train_properties.parquet # T7 训练(53,804个唯一地址) │ └── re_eval_inputs.parquet # T7 评估(23,190个唯一地址) ├── xbrl/ # 4680万标准化XBRL事实,覆盖92.6%股票代码 ├── filings/ # 295,860份SEC文件(10-K, 10-Q, 8-K, 20-F, 6-K, N-CSR, N-CSRS)— markdown + PDF ├── prices/ # OHLCV + 调整收盘价(yfinance) ├── fundamentals/ # 季度报表(yfinance,约320万行) ├── macro/ # 46个FRED + 7个EIA序列 └── manifest.json # 每个parquet文件的SHA-256哈希(可追溯)
数据配置
数据集包含以下配置,可通过Hugging Face数据集库加载:
| 配置名称 | 文件内容 |
|---|---|
panel_daily |
日度面板训练/测试集 |
panel_weekly |
周度面板训练/测试集 |
panel_monthly |
月度面板训练/测试集 |
scenarios_daily |
日度情景 |
valuation_inputs_daily |
公开估值输入 |
private_valuation_inputs_daily |
私人公司估值输入 |
generation_inputs_daily |
生成任务输入 |
generation_ground_truth_daily |
生成任务真实值 |
generator_eval_inputs_daily |
生成器评估输入 |
generator_eval_ground_truth_daily |
生成器评估真实值 |
scenario_forecast_ground_truth_daily |
情景预测真实值 |
real_estate_train |
房地产训练数据 |
real_estate_eval |
房地产评估数据 |
数据来源
已捆绑(无需用户凭证)
| 来源 | 内容 | 许可 |
|---|---|---|
| SEC EDGAR | 29.5万文档、4680万XBRL事实 | 公共领域(美国政府) |
| FRED | 46个宏观经济序列 | 公共领域 |
| EIA | 7个商品序列 | 公共领域 |
| yfinance | 价格(OHLCV)、基本面(季度)— 衍生特征 | 非商业用途 |
| RentCast | 地址级衍生特征(租金+价格目标、物业属性) | RentCast使用条款 — 仅限衍生特征 |
| 宏观经济事件 | 1,130个事件×49种类型 | CC-BY-4.0 |
未捆绑(需用户凭证)
| 来源 | 用户端要求 |
|---|---|
| 金融新闻提供商 | 用户自备新闻API密钥(用于collect_news.py) |
| RentCast原始数据 | 用户自备RentCast订阅(用于collect_real_estate.py原始模式) |
股票池
4,416只股票构成:
- 全罗素2000指数(1,923只IWM持仓)
- 全标普小盘600指数(72只仅IJR新增)
- iShares微型股(225只IWC新增)
- 2,196只三个指数外的纳斯达克/纽交所小盘股
- 构成:3,857家运营公司 + 333只基金 + 226个SPAC,含
security_type字段支持适用性分层
数据划分
- 预测任务(T1, T4): 按时间顺序70/30划分,分割日期为2024-09-03
- 估值+生成任务(T2, T3, T5, T6): 30%公司级留出 = 1,324只股票(随机种子=42),每个提供最新有效快照
- 房地产任务(T7): 30%地址级留出(随机,固定种子),含每个物业的时间轴特征
基准方法
数据集附带17个基线方法,涵盖7个家族:
- 4个朴素基线
- 2个经典方法
- 3个深度序列模型
- 3个零样本时间序列基础模型
- 2个LLM适配的多任务系统
- 3个零样本前沿LLM(gpt-oss-120b, gpt-5.1, gemini-3-flash + qwen35)
每个方法通过@register(name=…, family=…, tasks=…)注册,暴露sklearn风格的(fit, predict, save, load)接口。
许可证
- 数据: CC-BY-4.0(衍生特征+策划面板)
- 代码: MIT(
macrolens/,dataloader/,methods/,eval.py,experiments/) - 供应商库: 基于相应许可(MIT、Apache 2.0)
引用
bibtex @inproceedings{macrolens2026, title = {{MacroLens}: A Multi-Task Benchmark for Contextual Financial Reasoning under Macroeconomic Scenarios}, author = {<authors>}, booktitle = {Proceedings of the Annual Conference on Neural Information Processing Systems (NeurIPS), Datasets and Benchmarks Track}, year = {2026} }




