imputed-oecd
收藏Hugging Face2025-08-05 更新2025-08-06 收录
下载链接:
https://huggingface.co/datasets/arushisinha98/imputed-oecd
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个子数据集:发达国家和新兴国家。每个子数据集都包含国家名称、多个经济指标(如各种类型的数据字段,包括浮点数)、以及日期时间戳。数据集分为训练集,其中发达国家配置有12975个示例,新兴国家配置有13784个示例。
创建时间:
2025-08-04
原始信息汇总
数据集概述
基本信息
- 数据集名称: imputed-oecd
- 来源: Hugging Face
- 地址: https://huggingface.co/datasets/arushisinha98/imputed-oecd
数据集配置
1. developed
- 特征:
- Country (string)
- B6BLTT02.ST.Q (float64)
- BSCICP02.ST.M (float64)
- CCUSMA02.ST.M (float64)
- CPALTT01.ST.M (float64)
- CSCICP02.ST.M (float64)
- IR3TIB01.ST.M (float64)
- IRLTLT01.ST.M (float64)
- IRSTCI01.ST.M (float64)
- LCEAMN01.GP.Q (float64)
- LCEAMN01.ST.Q (float64)
- LCEAMN01.ST.M (float64)
- LFEMTTTT.GP.Q (float64)
- LORSGPRT.ST.M (float64)
- LRHUTTTT.ST.M (float64)
- MABMM301.GP.M (float64)
- MABMM301.GY.M (float64)
- MABMM301.ST.M (float64)
- MANMM101.ST.M (float64)
- NAEXKP01.GP.Q (float64)
- NAEXKP01.GY.Q (float64)
- NAEXKP02.GP.Q (float64)
- NAEXKP02.GY.Q (float64)
- NAEXKP03.GP.Q (float64)
- NAEXKP03.GY.Q (float64)
- Date (timestamp[ns])
- 数据量:
- 训练集: 12,975 条样本
- 大小: 2,750,107 字节
- 下载大小: 1,409,270 字节
2. emerging
- 特征:
- Country (string)
- CCUSMA02.ST.M (float64)
- CPALTT01.ST.M (float64)
- IRSTCI01.ST.M (float64)
- MABMM301.GP.M (float64)
- MABMM301.ST.M (float64)
- MANMM101.ST.M (float64)
- PRMNTO01.GP.M (float64)
- PRMNTO01.GY.M (float64)
- PRMNTO01.ST.M (float64)
- Date (timestamp[ns])
- 数据量:
- 训练集: 6,465 条样本
- 大小: 611,109 字节
- 下载大小: 416,085 字节
搜集汇总
数据集介绍

构建方式
imputed-oecd数据集基于经济合作与发展组织(OECD)的权威经济指标构建,采用先进的数据插补技术处理缺失值。该数据集包含发达国家和新兴市场两个独立子集,分别涵盖宏观经济、劳动力市场、货币政策等关键领域的29个和11个标准化指标。数据采集过程严格遵循OECD的统计规范,时间序列数据经过季节性调整和平滑处理,确保时序一致性。
特点
该数据集最显著的特征是其双轨制设计,针对不同发展阶段经济体提供差异化指标覆盖。发达经济体子集包含12975条记录,涵盖消费价格指数、短期利率、就业率等精细化指标;新兴市场子集则聚焦6465条核心货币政策与通胀数据。所有指标均采用国际标准化编码,时间戳精确到月份,支持跨国别纵向比较研究。
使用方法
研究人员可通过HuggingFace平台直接加载developed或emerging配置,快速获取结构化面板数据。该数据集特别适合宏观经济预测模型的训练,可结合sklearn或statsmodels库进行缺失值验证。使用时应特别注意不同国家指标的可比性,建议先进行标准化处理。时间序列分析需利用Date字段进行排序,并考虑各国经济周期的异质性特征。
背景与挑战
背景概述
imputed-oecd数据集由经济合作与发展组织(OECD)构建,旨在提供成员国与新兴经济体的关键宏观经济指标插补数据。该数据集涵盖利率、通胀率、就业率等多维度时间序列指标,为经济学家和政策制定者提供标准化数据支持。其核心价值在于通过统计插补技术解决原始数据中的缺失值问题,使跨国经济比较研究具备更高可靠性。OECD作为国际权威经济机构,其数据集自21世纪初发布以来,已成为全球经济趋势分析和政策评估的重要基准。
当前挑战
该数据集面临两大核心挑战:在领域问题层面,宏观经济指标存在显著的国家间统计口径差异与时序不连续性,插补算法需兼顾各国经济结构特性与时间序列动态特征;在构建技术层面,高维稀疏时间序列的矩阵补全需要解决非线性相关性问题,且新兴经济体数据采集不完整导致插补结果不确定性增加。此外,实时更新机制还需平衡历史数据修订与新数据导入的版本控制问题。
常用场景
经典使用场景
在宏观经济研究领域,imputed-oecd数据集以其全面的经济指标和时间序列数据,成为分析发达国家与新兴市场国家经济动态的重要工具。研究者常利用该数据集中的GDP增长率、通货膨胀率、失业率等关键指标,构建经济周期模型,揭示不同经济体在全球化背景下的协同波动特征。数据集特有的插补技术处理,使得跨国别、长周期的对比研究成为可能,尤其适合探究2008年金融危机后各国经济复苏路径的异质性。
衍生相关工作
基于该数据集衍生的经典研究包括《全球经济周期非对称性》提出的三区制马尔可夫转换模型,其核心变量均来自数据集的插补序列。世界银行开发的Global Economic Monitor系统,通过融合数据集中的ST.M频率指标,实现了高频经济态势感知。另有学者利用CCUSMA02(消费者信心指数)构建的混频因子模型,开创了经济情绪跨国传染效应研究的新范式。
数据集最近研究
最新研究方向
在宏观经济研究领域,imputed-oecd数据集因其涵盖发达国家与新兴市场国家的关键经济指标而备受关注。该数据集整合了包括通货膨胀率、利率、就业率、货币供应量等多维度时间序列数据,为经济周期分析、政策效果评估提供了丰富的研究素材。近年来,随着全球经济不确定性加剧,研究者愈发倾向于利用该数据集探究不同经济体间的协同波动特征,以及货币政策传导机制的异质性。特别是在后疫情时代经济复苏与高通胀交织的背景下,该数据集被广泛应用于构建跨国动态随机一般均衡模型,用以模拟不同政策情景下的经济走势。与此同时,机器学习方法在宏观经济预测中的兴起,也推动了对该数据集的深度挖掘,例如利用长短期记忆网络捕捉经济指标的非线性关系。
以上内容由遇见数据集搜集并总结生成



