S&P 500 index data

github2024-04-05 更新2024-05-31 收录

下载链接：

https://github.com/datasets/s-and-p-500

下载链接

链接失效反馈

官方服务：

资源简介：

S&P 500指数数据，包括自1870年以来的月度水平、股息、盈利和市盈率。S&P 500（标准普尔500指数）是美国市值最大的500家公开上市公司的自由浮动、市值加权指数。

The S&P 500 index data, encompassing monthly levels, dividends, earnings, and price-to-earnings ratios since 1870. The S&P 500 (Standard & Poor's 500 Index) is a free-float, market capitalization-weighted index of the 500 largest publicly traded companies in the United States.

创建时间：

2011-12-11

原始信息汇总

数据集概述

数据内容

S&P 500指数数据：包括水平、股息、盈利和市盈率，自1870年以来的月度数据。
数据类型：股票价格、股息、盈利数据以及消费者价格指数（用于转换为实际价值）。

数据来源

数据由经济学家Robert Shiller收集并准备，原始数据可在其网站上获取。
数据源包括：
- 股票价格：月平均日收盘价，截至2000年1月。
- 股息和盈利：1926年后的数据来自S&P四季度总额，采用线性插值法计算月度数据；1926年前的数据来自Cowles和Associates的研究，同样采用插值法。
- 消费者价格指数(CPI-U)：1913年后的数据来自美国劳工统计局，1913年前的数据通过与Warren和Pearson的价格指数连接进行估算。

数据处理

数据已整理并转换为CSV格式。
为了绘图，通胀调整后的系列数据被乘以一个常数，使得2000年1月的价值等于其名义价值，即所有价格以2000年1月的美元计。

数据许可

原始数据未明确声明许可，但根据数据规模和事实性质，可假设为公共领域。
维护者明确将数据许可为ODC公共领域奉献和许可（PDDL）。

致谢

建议在使用数据时，对Robert Shiller表示感谢，因其准备并公开了此数据集。

搜集汇总

数据集介绍

构建方式

S&P 500指数数据集由经济学家罗伯特·席勒（Robert Shiller）收集并整理，涵盖了自1870年以来的月度数据，包括指数水平、股息、收益和市盈率等关键指标。数据来源包括席勒在其著作《非理性繁荣》中使用的股票市场数据，以及来自Cowles及其同事的早期年度数据。月度股息和收益数据自1926年起通过线性插值法从S&P四季度总和中计算得出，而股票价格数据则为每日收盘价的月度平均值。消费者价格指数（CPI-U）自1913年开始使用，1913年之前的数据则通过Warren和Pearson的价格指数进行拼接。

特点

该数据集的特点在于其时间跨度长达一个多世纪，提供了丰富的月度历史数据，涵盖了S&P 500指数的多个关键财务指标。数据经过精心整理和标准化处理，确保了数据的连续性和一致性。此外，数据集还包含了经过通胀调整的系列数据，使得用户能够以2000年1月的美元价值为基础进行有效比较。数据的公开性和透明性也为学术研究和市场分析提供了坚实的基础。

使用方法

用户可以通过CSV格式轻松访问和下载该数据集，适用于各种数据分析工具和编程语言。数据集的结构清晰，每列数据均有明确的标签，便于用户进行数据清洗、分析和可视化。研究人员可以利用该数据集进行长期市场趋势分析、经济周期研究以及投资策略的验证。此外，数据集还适用于教学和培训，帮助学生和从业者更好地理解金融市场的历史演变和关键指标的变化规律。

背景与挑战

背景概述

S&P 500指数数据集由经济学家罗伯特·席勒（Robert Shiller）创建，首次发布于2000年，作为其著作《非理性繁荣》（Irrational Exuberance）的配套数据。该数据集涵盖了自1870年以来的月度数据，包括指数水平、股息、收益以及市盈率等关键指标。S&P 500指数作为衡量美国股市表现的重要基准，其数据不仅为金融市场的历史研究提供了宝贵资源，也为宏观经济分析和投资策略制定提供了重要参考。席勒通过整合多种历史数据源，包括Cowles及其同事的年报数据以及美国劳工统计局的消费者价格指数（CPI），构建了这一具有深远影响力的数据集。

当前挑战

S&P 500指数数据集的构建面临多重挑战。首先，数据的长期性和多样性要求对历史数据进行复杂的整合与插值处理，尤其是在1926年之前的数据主要依赖于年报数据，需要通过线性插值方法转换为月度数据。其次，消费者价格指数（CPI）的早期数据缺失问题需要通过与其他价格指数（如Warren和Pearson的指数）进行拼接和调整来解决。此外，数据的时间跨度长达一个多世纪，期间经济环境、市场结构和统计方法的变化对数据的一致性和可比性提出了严峻考验。最后，尽管数据集在金融研究领域具有重要价值，但其原始数据的许可信息不明确，可能对数据的广泛使用和引用造成一定限制。

常用场景

经典使用场景

S&P 500指数数据集广泛应用于金融市场的历史分析，特别是在研究股票市场的长期趋势和周期性波动方面。研究者利用该数据集中的月度数据，包括股价、股息、收益和市盈率，来构建模型预测市场行为，评估投资策略的有效性。此外，该数据集还被用于宏观经济研究，分析股市与经济增长、通货膨胀等宏观经济指标之间的关系。

解决学术问题

该数据集解决了金融经济学中的多个关键问题，特别是关于市场效率、资产定价模型和投资者行为的研究。通过提供自1870年以来的长期历史数据，研究者能够深入探讨市场波动的原因，验证有效市场假说，并评估不同经济周期下的投资回报。此外，数据集中的通货膨胀调整数据为研究实际回报率提供了重要依据，帮助学者更好地理解长期投资的实际收益。

衍生相关工作

基于S&P 500指数数据集，衍生了许多经典的学术研究和应用工作。例如，诺贝尔经济学奖得主罗伯特·席勒在其著作《非理性繁荣》中利用该数据集分析了股市泡沫的形成与破裂。此外，该数据集还被用于开发多种金融模型，如资本资产定价模型（CAPM）和波动率模型。近年来，随着机器学习的兴起，该数据集也被用于训练预测模型，探索股市的复杂非线性关系。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集