five

GME Data

收藏
github2024-05-23 更新2024-05-31 收录
下载链接:
https://github.com/tangentstorm/gme-data
下载链接
链接失效反馈
资源简介:
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

Data related to the 2021 GameStop stock activity, including daily consolidated GME short volume data, daily failed delivery data, number of shares available for borrowing, options chain data, and open/high/low/close/volume bar charts across different time frames.
创建时间:
2021-03-16
原始信息汇总

GME Data 数据集概述

数据集内容

gme 目录

  • shortvol.txt: 每日汇总GME股票的卖空量数据。
  • ftd.txt: 每日GME及相关ETF的未能交付数据。
  • ibkr/borrowable/*: 可借股票数量,包括GME、GS2C及多种ETF。
  • options/*/*: 来自Webull的期权链数据,每5分钟一次快照。
  • bars/*/*: 不同时间框架的开盘/最高/最低/收盘/成交量数据,当前为1小时数据,覆盖1年。

raw 目录

  • sec/ftd/*.txt: 来自SEC的整个市场的未能交付原始数据。
  • finra/*/*.txt: 来自FINRA的跨交易所卖空量报告。

数据更新周期

  • shortvol.txt: 每日更新
  • ftd.txt: 每两周更新
  • ibkr/borrowable/*: 每15分钟更新
  • options/*/*: 每5分钟更新
  • bars/*/*: 未指定更新周期
  • sec/ftd/*.txt: 每两周更新
  • finra/*/*.txt: 每日更新

数据处理脚本

  • finra_shortvol.py: 用于获取和生成卖空量数据的Python脚本。
  • borrowable.py: 用于从Interactive Brokers获取可借股票数据的Python脚本。
  • ftd.sh: 用于提取未能交付数据的Shell脚本。
  • wb-opts.py: 用于从Webull获取期权链数据的Python脚本。
  • ibkr_bars.py: 用于从Interactive Brokers获取蜡烛图和成交量数据的Python脚本。
  • publish.sh: 用于将数据发布到GitHub的Shell脚本。
  • crontab.txt: 用于安排上述程序运行的crontab配置文件。
AI搜集汇总
数据集介绍
main_image_url
构建方式
GME Data数据集的构建基于对Gamestop股票(NYSE: GME, XFRA: GS2C)及其相关交易所交易基金(ETFs)的深入分析。数据集的构建过程涉及从多个权威来源获取原始数据,包括美国证券交易委员会(SEC)和金融业监管局(FINRA)。通过自动化脚本,如`finra_shortvol.py`、`borrowable.py`和`ftd.sh`,定期获取和处理这些原始数据,生成每日、每两周和每15分钟的更新数据。此外,`wb-opts.py`和`ibkr_bars.py`脚本用于从Webull和Interactive Brokers获取期权链和K线图数据,确保数据的全面性和实时性。
特点
GME Data数据集的显著特点在于其高频率和多维度的数据更新。数据集不仅涵盖了Gamestop股票的每日空头交易量和每两周的交割失败数据,还提供了每15分钟的借入股票数量和每5分钟的期权链数据。此外,数据集还包括不同时间框架的K线图数据,如每小时的OHLCV数据,为分析提供了丰富的历史背景。这些数据的高频率更新和多维度特性,使得GME Data成为金融分析和算法交易领域的宝贵资源。
使用方法
GME Data数据集的使用方法多样,适用于金融分析师、量化交易员和学术研究人员。用户可以通过访问`gme`目录下的各类数据文件,获取Gamestop股票及其相关ETFs的详细交易信息。例如,`shortvol.txt`文件提供了每日的空头交易量数据,而`ftd.txt`文件则包含了交割失败数据。对于需要实时数据的用户,可以通过运行`crontab.txt`中的定时任务,自动更新数据集。此外,数据集的构建脚本和原始数据文件也提供了透明度和可重复性,便于用户进行深入分析和验证。
背景与挑战
背景概述
GME Data数据集聚焦于2021年GameStop股票(NYSE: GME, XFRA: GS2C)的活动,由一群匿名的研究人员或机构创建。该数据集的核心研究问题围绕GameStop股票的市场行为,特别是其短期交易量、未能交付的数据以及可借股票的数量等。通过提供详细的每日、每两周和每五分钟的快照数据,GME Data为金融市场的研究者提供了宝贵的资源,有助于深入分析和理解股票市场的动态行为,尤其是在高度波动的市场环境中。
当前挑战
GME Data在构建过程中面临多重挑战。首先,数据来源的多样性和复杂性,包括从SEC、FINRA等官方机构获取的原始数据,以及从Webull和Interactive Brokers等交易平台获取的实时数据,增加了数据整合和处理的难度。其次,数据的高频更新需求,如每五分钟更新的期权链数据和每15分钟更新的可借股票数据,要求高效的自动化数据抓取和处理系统。此外,确保数据的准确性和一致性,特别是在处理高波动性股票数据时,也是一个重要的挑战。
常用场景
经典使用场景
在金融分析领域,GME Data数据集的经典使用场景主要集中在对GameStop股票及其相关交易所交易基金(ETFs)的市场行为进行深入分析。通过该数据集,研究者可以获取GameStop股票的每日合并空头交易量、每日未能交付数据、可借股票数量以及不同时间框架下的开盘/最高/最低/收盘/成交量数据。这些数据为研究市场操纵、投资者行为以及市场流动性提供了宝贵的资源。
解决学术问题
GME Data数据集解决了金融市场中多个重要的学术研究问题。首先,它为研究市场操纵行为提供了详细的数据支持,特别是通过分析空头交易量和未能交付数据,可以揭示潜在的市场操纵模式。其次,该数据集有助于研究投资者行为,通过分析不同时间框架下的交易数据,可以深入了解投资者的情绪和决策过程。此外,该数据集还为研究市场流动性和价格发现机制提供了实证基础。
衍生相关工作
GME Data数据集的发布催生了一系列相关的经典工作。首先,许多研究者利用该数据集进行了深入的市场操纵行为研究,发表了多篇高影响力的学术论文。其次,该数据集为金融科技公司提供了开发新型金融工具和算法的基础,推动了金融科技的创新。此外,GME Data数据集还激发了社区对金融市场透明度和监管政策的讨论,促进了相关政策和法规的完善。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作