oecd_filled_dataset
收藏Hugging Face2025-07-17 更新2025-07-18 收录
下载链接:
https://huggingface.co/datasets/arushisinha98/oecd_filled_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个浮点数字段,用于表示不同的测量值,还包括国家(Country)和时间戳(Period)字段。数据集分为训练集,共有14652个示例。
This dataset contains multiple floating-point fields that represent different measurement values, along with the Country and Period fields. The dataset is split into a training set, which has a total of 14,652 samples.
创建时间:
2025-07-15
原始信息汇总
OECD填充数据集概述
数据集基本信息
- 数据集名称: OECD填充数据集
- 存储位置: https://huggingface.co/datasets/arushisinha98/oecd_filled_dataset
- 下载大小: 1,364,951字节
- 数据集大小: 4,936,577字节
- 训练集样本数: 22,457
数据集特征
数据集包含以下特征字段:
经济指标特征
B6BLTT02.ST.Q: 季度数据,float64类型BSCICP02.ST.M: 月度数据,float64类型CCUSMA02.ST.M: 月度数据,float64类型CPALTT01.ST.M: 月度数据,float64类型CSCICP02.ST.M: 月度数据,float64类型IR3TIB01.ST.M: 月度数据,float64类型IRLTLT01.ST.M: 月度数据,float64类型IRSTCI01.ST.M: 月度数据,float64类型LCEAMN01.GP.M: 月度数据,float64类型LCEAMN01.GY.M: 月度数据,float64类型LCEAMN01.ST.M: 月度数据,float64类型LFEMTTTT.GP.M: 月度数据,float64类型LFEMTTTT.ST.M: 月度数据,float64类型LORSGPRT.ST.M: 月度数据,float64类型LRHUTTTT.ST.M: 月度数据,float64类型MABMM301.GP.M: 月度数据,float64类型MABMM301.GY.M: 月度数据,float64类型MABMM301.ST.M: 月度数据,float64类型MANMM101.ST.M: 月度数据,float64类型NAEXKP01.GP.Q: 季度数据,float64类型NAEXKP01.GY.Q: 季度数据,float64类型NAEXKP02.GP.Q: 季度数据,float64类型NAEXKP02.GY.Q: 季度数据,float64类型NAEXKP03.GP.Q: 季度数据,float64类型NAEXKP03.GY.Q: 季度数据,float64类型
基础信息特征
Country: 国家信息,string类型Date: 日期信息,timestamp[ns]类型
数据划分
- 训练集: 包含22,457个样本,占用4,936,577字节存储空间
搜集汇总
数据集介绍

构建方式
在经济合作与发展组织(OECD)的权威数据框架下,该数据集通过系统整合成员国上报的标准化经济指标构建而成。采用自动化流程从官方统计平台提取原始数据,并经过多重验证确保数值一致性,缺失值则通过时间序列插值和跨国比对方法进行填补,最终形成覆盖全球主要经济体的结构化面板数据。
特点
数据集囊括1960年至今的年度经济数据,涵盖GDP增长率、贸易平衡、劳动力市场等核心指标,具有跨国家、跨时间维度的双重特性。其突出优势在于通过算法填补了历史数据缺口,确保时序连续性,且所有指标均采用国际统一统计口径,支持跨国比较研究。
使用方法
研究者可通过HuggingFace平台直接加载数据集至Pandas或NumPy环境,利用国家代码和年份字段进行多维筛选。建议先使用describe()方法查看分布特征,对缺失值标记字段需特别注意。该数据适用于面板回归、时间序列分析等计量经济模型,亦可与地理信息系统结合进行空间可视化分析。
背景与挑战
背景概述
经济合作与发展组织(OECD)作为全球权威的经济政策研究机构,致力于构建跨国可比的高质量数据库以支持宏观经济分析。OECD填充数据集整合了成员国在经济增长、就业、贸易等多维度的标准化指标,由OECD统计部门主导开发,旨在解决全球经济数据碎片化与可比性问题。该数据集自20世纪中期持续更新,为政策制定者、研究人员提供可靠的实证基础,显著推动了国际经济比较研究与政策评估的科学化进程。
当前挑战
该数据集核心挑战在于解决宏观经济指标跨国可比性难题,包括各国统计口径差异、数据缺失与时效性不一致等问题。构建过程中需克服多语言数据整合、非标准化报表转换以及历史数据回溯填充等技术障碍,同时确保数据来源的权威性与跨年度连续性,这对数据清洗、插值方法与验证机制提出了极高要求。
常用场景
经典使用场景
在经济政策分析领域,oecd_filled_dataset凭借其全面的跨国经济指标填补了传统数据的空白,常被用于构建宏观经济预测模型。研究人员通过该数据集的时间序列完整性,能够有效分析不同国家政策干预下的经济动态响应,为比较研究提供坚实的数据基础。
解决学术问题
该数据集解决了跨国经济研究中因数据缺失导致的分析偏差问题,支持学者进行长期经济趋势推断和因果效应检验。其标准化处理方式显著提升了国际经济实证研究的可靠性与可比性,对推动宏观计量经济学方法论发展具有深远意义。
衍生相关工作
基于该数据集衍生的研究包括经济韧性指数构建、政策效应异质性分析等经典工作。例如结合机器学习方法开发的跨国经济危机预警系统,以及发表于顶级期刊的财政政策乘数跨国比较研究,均体现了该数据集的学术影响力。
以上内容由遇见数据集搜集并总结生成



