five

S&P 500 index data|金融市场数据集|历史数据数据集

收藏
github2024-04-05 更新2024-05-31 收录
金融市场
历史数据
下载链接:
https://github.com/datasets/standard-and-poors-500-shiller
下载链接
链接失效反馈
资源简介:
该数据集提供了自1870年以来的S&P 500指数数据,包括水平、股息、盈利和市盈率等,每月更新。数据集由经济学家Robert Shiller收集并准备,旨在提供美国500家主要上市公司的市场表现数据。

This dataset provides S&P 500 index data since 1870, including levels, dividends, earnings, and price-to-earnings ratios, updated monthly. The dataset was collected and prepared by economist Robert Shiller, aiming to provide market performance data of the 500 major listed companies in the United States.
创建时间:
2011-12-11
原始信息汇总

数据集概述

数据集内容

  • S&P 500指数数据:包括水平、股息、盈利和市盈率,自1870年起每月数据。
  • 数据类型:股票价格、股息、盈利数据及消费者价格指数(用于转换为实际价值)。

数据源与构造

  • 源数据:由经济学家Robert Shiller收集并准备,原始数据可从其网站获取。
  • 数据构造
    • 股票价格:每月平均日收盘价,截至2000年1月。
    • 股息与盈利:自1926年起,使用S&P四季度总和进行线性插值至每月数据;1926年前的数据来自Cowles和Associates的研究,同样进行年度至月度的插值。
    • 消费者价格指数(CPI-U):自1913年起,之前年份通过与Warren和Pearson的价格指数拼接。

数据集使用许可

  • 许可声明:原始数据未明确声明许可,但基于数据的大小和事实性质,可假设为公共领域。维护者明确表示按照ODC公共领域奉献和许可(PDDL)授权。
  • 致谢:建议在使用数据时,对Robert Shiller的准备工作和公开数据表示感谢。
AI搜集汇总
数据集介绍
main_image_url
构建方式
S&P 500指数数据集由经济学家罗伯特·席勒(Robert Shiller)精心构建,涵盖了自1870年以来的月度数据,包括指数水平、股息、收益以及市盈率等关键指标。数据来源多样,1926年后的月度股息和收益数据基于标准普尔四季度总和,并通过线性插值法转换为月度数据;1926年之前的数据则来源于Cowles及其同事的年报数据,同样经过插值处理。股票价格数据为每日收盘价的月度平均值,消费者价格指数(CPI-U)则自1913年起由美国劳工统计局发布,1913年之前的数据通过Warren和Pearson的价格指数进行拼接。
特点
该数据集以其全面性和历史深度著称,不仅提供了S&P 500指数的核心财务指标,还包含了经过通货膨胀调整后的实际价值,使得研究者能够更准确地分析长期市场趋势。数据的月度频率为研究市场波动和经济周期提供了高时间分辨率,而涵盖的广泛时间跨度则使得跨世纪的经济现象研究成为可能。此外,数据集经过整理并以CSV格式提供,便于数据分析和处理。
使用方法
使用该数据集时,研究者可以直接下载CSV文件,利用数据分析工具如Python、R或Excel进行数据处理和可视化。数据集中的通货膨胀调整数据特别适合用于长期经济趋势分析,而原始名义数据则可用于短期市场动态研究。在进行学术研究或市场分析时,建议引用罗伯特·席勒的原始工作,以尊重其数据贡献。此外,由于数据集的公共领域性质,用户可以自由地用于商业和非商业目的,但需注意数据的准确性和适用性。
背景与挑战
背景概述
S&P 500指数数据集由经济学家罗伯特·席勒(Robert Shiller)整理并公开,涵盖了自1870年以来的月度数据,包括指数水平、股息、收益以及市盈率等关键指标。该数据集最初用于席勒的著作《非理性繁荣》(Irrational Exuberance),旨在研究美国股市的长期表现及其与经济周期的关系。作为美国最具代表性的股票市场指数之一,S&P 500指数反映了美国顶级500家上市公司的市场表现,其数据来源包括标准普尔公司、考尔斯基金会(Cowles and Associates)以及美国劳工统计局的消费者价格指数(CPI)。这一数据集为金融经济学、资产定价和市场波动性研究提供了重要的历史参考,对学术界和投资界均产生了深远影响。
当前挑战
S&P 500指数数据集的构建面临多重挑战。首先,数据的时间跨度长达150余年,期间数据来源和统计方法发生了显著变化,如何确保数据的一致性和可比性成为核心问题。例如,1926年之前的数据主要依赖于年度数据的插值,而之后的数据则基于季度数据的线性插值,这种差异可能导致数据精度的波动。其次,消费者价格指数(CPI)的构建涉及多个历史数据源的拼接和调整,特别是在1913年之前的数据处理中,需要依赖Warren和Pearson的价格指数进行转换,这一过程可能引入误差。此外,数据集的公开性和许可问题也值得关注,尽管数据集被视为公共领域,但其原始数据的版权归属和引用规范仍需明确,以确保学术研究的合规性。
常用场景
经典使用场景
S&P 500指数数据集广泛应用于金融市场的历史分析和经济研究。研究者利用该数据集中的月度数据,包括股价、股息、收益和市盈率,深入探讨美国股市的长期趋势和周期性波动。通过对这些数据的分析,学者能够揭示市场行为背后的经济规律,为投资策略的制定提供科学依据。
实际应用
在实际应用中,S&P 500指数数据集被广泛用于投资组合管理、风险评估和资产定价模型的构建。金融机构和投资者利用这些数据来预测市场走势,优化资产配置,并评估不同经济环境下的投资回报。此外,该数据集还为政策制定者提供了重要的参考,帮助他们理解市场动态和经济政策的长期影响。
衍生相关工作
基于S&P 500指数数据集,许多经典研究得以展开。例如,诺贝尔经济学奖得主罗伯特·席勒在其著作《非理性繁荣》中利用该数据集分析了股市泡沫的形成与破裂。此外,该数据集还催生了大量关于市场效率、行为金融学和资产定价模型的研究,为现代金融理论的发展提供了重要的实证支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

微博与抖音评论数据集

数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。

github 收录

COVID-19 Data Hub

COVID-19 Data Hub是一个全球性的COVID-19数据集,包含了来自多个国家和地区的疫情数据,涵盖了病例数、死亡数、康复数、测试数等信息。此外,数据集还包括了与疫情相关的经济、社会和政策数据。

covid19datahub.io 收录

AFD-dataset

我们创建了迄今为止最大的亚洲人脸数据集,包含360,000张人脸图片,涉及2019个人。相比之下,第二大的亚洲人脸数据集CASIA-FaceV5仅包括2500张图片和500个人。

github 收录