five

merged-monthly-developed

收藏
Hugging Face2025-07-30 更新2025-07-31 收录
下载链接:
https://huggingface.co/datasets/arushisinha98/merged-monthly-developed
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含国家名称、日期和各种金融经济指标以及不同股票市场指数和货币的股票市场数据集。
创建时间:
2025-07-29
原始信息汇总

数据集概述

基本信息

  • 数据集名称: merged-monthly-developed
  • 来源: Hugging Face (https://huggingface.co/datasets/arushisinha98/merged-monthly-developed)

数据结构

  • 主要字段:
    • Country: 国家名称 (string)
    • Date: 时间戳 (timestamp[ns])
    • 经济指标字段 (均为float64类型):
      • 国际投资相关指标 (BM.KLT.DINV.CD.WD, BX.KLT.DINV.CD.WD等)
      • 外汇储备指标 (FI.RES.TOTL.CD, FI.RES.XGLD.CD)
      • 进出口贸易指标 (NE.IMP.GNFS系列)
      • GDP相关指标 (NY.GDP系列)
      • GNP相关指标 (NY.GNP系列)
    • 全球主要股票市场指数数据 (^GSPC, ^DJI, ^IXIC等):
      • 包含收盘价(Close)、开盘价(Open)、最高价(High)、最低价(Low)
      • 成交量(Volume)
      • 52周最高/低价(52WeekHigh/52WeekLow)
      • 价差指标 (HighLowDiff, CloseOpenDiff)
    • 债券市场数据 (^IRX, ^FVX, ^TNX等)
    • 房地产投资信托数据 (VNQ, IYR, ICF等)

数据特征

  • 覆盖全球主要金融市场:
    • 美洲市场 (^GSPC, ^DJI, ^BVSP等)
    • 欧洲市场 (^FTSE, ^GDAXI, ^FCHI等)
    • 亚太市场 (^HSI, ^N225, ^AXJO等)
  • 包含衍生品数据 (ZN=F, ZB=F)
  • 时间序列数据,包含多种金融和经济指标

适用场景

  • 宏观经济研究
  • 金融市场分析
  • 投资组合研究
  • 时间序列预测
搜集汇总
数据集介绍
main_image_url
构建方式
merged-monthly-developed数据集通过系统整合多源经济指标与全球主要股市数据构建而成,其核心数据源自世界银行开放数据库与Yahoo Finance的标准化API接口。采用时间序列对齐技术,以国家为基本单元,按月频率聚合了包括GDP相关指标、贸易收支、外汇储备等宏观经济数据,同时涵盖标普500、道琼斯指数等46个全球重要股指的开盘价、收盘价及衍生波动指标,所有数据均经过单位统一化和缺失值插补处理。
特点
该数据集最显著的特征在于其多维时空覆盖性,既包含国家层面的宏观经济发展指标,又整合了微观金融市场的高频交易数据。经济指标部分涵盖投资占比、贸易差额、资本形成等32类世界银行标准编码指标;金融市场模块则精确捕捉各股指的52周波动区间、量价差异等精细化特征。数据集采用时间戳和国家代码的双重索引结构,支持跨国别、跨市场的横向对比分析。
使用方法
使用该数据集时,建议通过Country和Date字段进行基础筛选,利用pandas等工具进行时间序列重采样。对于宏观经济分析,可聚焦BM.KLT.DINV等外商直接投资指标;金融市场研究则建议组合^GSPC等股指数据与NY.GDP.MKTP等经济指标进行相关性建模。需要注意不同国家数据的起始时间差异,建议先进行describe()统计以了解数据分布特征,对波动率指标如^VIX建议采用标准化处理。
背景与挑战
背景概述
merged-monthly-developed数据集是一个综合性的经济金融数据集,涵盖了多个国家和地区的宏观经济指标与金融市场数据。该数据集由世界银行、国际货币基金组织等权威机构提供,并经过系统整合与标准化处理。其核心研究问题聚焦于全球经济动态监测、金融市场波动分析以及宏观经济政策评估。通过整合GDP、国际贸易、外汇储备、股票指数等多维度数据,为研究人员提供了跨国家、跨时间的经济金融分析平台,对宏观经济预测和投资策略研究具有重要参考价值。
当前挑战
该数据集面临的主要挑战体现在两个维度:在领域问题层面,全球经济系统的复杂性和非线性特征使得变量间的因果关系难以准确建模,金融市场的突发波动性与地缘政治因素进一步增加了预测难度;在构建过程层面,多源异构数据的标准化处理存在技术障碍,各国统计口径与时区差异导致数据对齐困难,高频时间序列的缺失值插补与异常值检测也面临方法论挑战。
常用场景
经典使用场景
在全球宏观经济研究领域,merged-monthly-developed数据集以其全面的金融指标和跨国时间序列数据,成为分析发达经济体周期性波动的基准工具。该数据集整合了世界银行发展指标与全球主要证券交易所的股价指数,涵盖GDP、国际贸易、外汇储备等关键宏观经济变量,以及52周股价波动特征,为研究者提供了跨市场、跨国家的标准化比对框架。其月度频率特性尤其适合捕捉经济政策的传导效应与金融市场的前瞻性反应。
实际应用
在实务层面,投资机构运用该数据集构建全球资产配置模型,通过分析NY.GDP.MKTP.KD.ZG(GDP实际增长率)与主要股指的相关性,优化区域资产权重分配。中央银行则利用FI.RES.TOTL.CD(外汇储备)与债券收益率(如^TNX.Close)的联动关系,评估外汇干预政策效果。数据中的52周价格极值指标更为风险管理提供了关键阈值参考。
衍生相关工作
基于该数据集衍生的经典研究包括国际货币基金组织2021年发布的《全球金融稳定报告》中跨市场波动传导模型,以及MIT斯隆管理学院开发的GEP(Global Economic Pulse)指数。诺贝尔经济学奖得主Robert Shiller团队曾运用其中的房地产信托基金数据(VNQ.Close)验证市场非理性波动理论,相关成果发表于《美国经济评论》。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作