PolyAgent/marketpulse-foresight
收藏Hugging Face2026-04-01 更新2026-04-05 收录
下载链接:
https://hf-mirror.com/datasets/PolyAgent/marketpulse-foresight
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: full
features:
- name: prompt
dtype: string
- name: outcome
dtype: int64
- name: market_price
dtype: float64
- name: domain
dtype: string
- name: source
dtype: string
- name: market_id
dtype: string
- name: horizon_days
dtype: float64
- name: prediction_date
dtype: string
- name: resolution_date
dtype: string
splits:
- name: train
num_bytes: 7799206
num_examples: 1642
- name: test
num_bytes: 1371428
num_examples: 316
download_size: 2939696
dataset_size: 9170634
- config_name: news_only
features:
- name: prompt
dtype: string
- name: outcome
dtype: int64
- name: market_price
dtype: float64
- name: domain
dtype: string
- name: source
dtype: string
- name: market_id
dtype: string
- name: horizon_days
dtype: float64
- name: prediction_date
dtype: string
- name: resolution_date
dtype: string
splits:
- name: train
num_bytes: 7656253
num_examples: 1642
- name: test
num_bytes: 1354134
num_examples: 316
download_size: 2865804
dataset_size: 9010387
- config_name: price_only
features:
- name: prompt
dtype: string
- name: outcome
dtype: int64
- name: market_price
dtype: float64
- name: domain
dtype: string
- name: source
dtype: string
- name: market_id
dtype: string
- name: horizon_days
dtype: float64
- name: prediction_date
dtype: string
- name: resolution_date
dtype: string
splits:
- name: train
num_bytes: 2647659
num_examples: 1642
- name: test
num_bytes: 360315
num_examples: 316
download_size: 515935
dataset_size: 3007974
configs:
- config_name: full
data_files:
- split: train
path: full/train-*
- split: test
path: full/test-*
- config_name: news_only
data_files:
- split: train
path: news_only/train-*
- split: test
path: news_only/test-*
- config_name: price_only
data_files:
- split: train
path: price_only/train-*
- split: test
path: price_only/test-*
---
提供机构:
PolyAgent
搜集汇总
数据集介绍

构建方式
在金融市场预测领域,marketpulse-foresight数据集通过精心设计的结构化流程构建而成。该数据集整合了多元化的市场信息来源,包括新闻文本与历史价格数据,并依据预测时间范围与市场领域进行系统化分类。每条数据记录均标注了明确的预测日期与结算日期,确保了时间序列的连贯性与可追溯性。数据采集过程注重来源的多样性与时效性,涵盖了不同市场标识下的特定事件,从而构建出一个层次分明、信息完备的金融预测语料库。
使用方法
研究人员可依据具体实验目标灵活选用数据集的三种配置版本,完整版适用于融合多模态信息的预测模型,而新闻版与价格版则分别服务于文本分析或时序建模任务。数据集已预分为训练集与测试集,便于直接应用于模型训练与性能验证。在使用过程中,可结合预测日期、结算日期及市场标识等元数据进行细粒度分析,或利用领域与来源字段开展跨市场泛化能力研究,从而系统评估模型在金融事件预测中的准确性与鲁棒性。
背景与挑战
背景概述
MarketPulse-Foresight数据集聚焦于金融市场预测领域,旨在通过整合新闻文本与价格时序数据,探索事件驱动型市场动态的量化建模。该数据集由前沿研究机构构建,核心研究问题在于如何利用多模态信息提升对特定市场事件未来结果的预测精度,其影响力延伸至金融科技与计算社会科学交叉领域,为基于大语言模型的预测系统提供了基准测试平台。
当前挑战
该数据集致力于解决金融市场事件结果预测的挑战,其核心难点在于如何从非结构化的新闻文本中提取有效信号,并与高噪声的时序价格数据融合,以应对市场的高波动性与外部事件干扰。构建过程中的挑战涉及多源异构数据的对齐与清洗,需确保新闻事件与市场标的在时间窗口上的精确匹配,同时维护预测目标在时间序列上的逻辑一致性,避免未来信息泄露。
常用场景
经典使用场景
在金融预测与市场分析领域,MarketPulse-Foresight数据集为研究者提供了一个评估语言模型预测能力的基准平台。该数据集整合了市场事件描述、历史价格数据及时间序列信息,典型应用场景涉及训练和测试模型对未来市场结果的二元分类预测。通过结合新闻文本与价格序列,模型能够学习从多模态输入中推断市场动向,为量化金融中的事件驱动预测任务奠定数据基础。
解决学术问题
该数据集致力于解决金融自然语言处理中事件对市场影响量化评估的难题。它通过结构化标注的事件描述与对应市场结果,使得研究者能够系统探究语言模型如何从文本中提取信号并生成可靠预测。这有助于突破传统时间序列预测仅依赖数值数据的局限,推动跨模态金融预测方法的发展,并为市场效率假说下的信息整合机制提供实证分析依据。
实际应用
在实际金融科技应用中,MarketPulse-Foresight数据集可支撑自动化交易系统、风险预警工具及投资决策辅助平台的开发。基于该数据集训练的模型能够实时解析财经新闻,结合市场数据预测短期价格走势,帮助机构投资者识别事件驱动型交易机会。此外,它还可用于构建监管科技中的市场情绪监测系统,提升对系统性风险的感知与应对能力。
数据集最近研究
最新研究方向
在金融预测与自然语言处理交叉领域,marketpulse-foresight数据集正推动前沿研究聚焦于多模态信息融合与事件驱动预测模型。该数据集整合新闻文本与市场价格时序数据,为探索大语言模型在金融市场中的因果推理与不确定性量化能力提供了基准。近期研究热点围绕如何利用提示工程与领域自适应技术,从非结构化新闻中提取事件信号,并与结构化价格序列协同建模,以提升对市场波动与极端事件的预测鲁棒性。这一方向不仅呼应了金融科技领域对可解释AI的迫切需求,也为量化投资与风险管理中的自动化决策系统提供了新的数据驱动范式。
以上内容由遇见数据集搜集并总结生成



