five

hikitoxin/bigstock-1h

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/hikitoxin/bigstock-1h
下载链接
链接失效反馈
官方服务:
资源简介:
BigStock数据集包含720多天的历史股票数据,以一小时为间隔,包括完整的蜡烛图数据(开盘价、收盘价、最低价、最高价)和成交量数据。数据以美元计价,并遵循GPL v3许可证。数据集适用于时间序列预测、金融建模和强化学习等任务。然而,数据的时间跨度相对较短(约2年),且可能存在缺失、错误或不可靠的数据。数据集来源于Yahoo Finance网站,使用yfinance库进行收集和处理。

The BigStock dataset contains historical stock data spanning over 720 days, recorded at one-hour intervals. It includes open, close, high, low prices, and volume, all in USD. The dataset is suitable for tasks such as time series forecasting, financial modeling, and reinforcement learning. The data is sourced from Yahoo Finance and collected using the yfinance library. Despite its large size, the dataset only covers a short-term period of about two years, which may introduce biases towards recent market trends. Additionally, the data may contain missing, incorrect, or unreliable information, and should be validated before use.
提供机构:
hikitoxin
原始信息汇总

BigStock 数据集概述

数据集信息

特征

  • timestamp: 时间戳,数据类型为字符串。
  • ticker: 股票代码,数据类型为字符串。
  • open: 开盘价,数据类型为浮点数。
  • high: 最高价,数据类型为浮点数。
  • low: 最低价,数据类型为浮点数。
  • close: 收盘价,数据类型为浮点数。
  • volume: 交易量,数据类型为整数。
  • source: 数据来源,数据类型为字符串。
  • retreived: 数据获取时间,数据类型为字符串。

数据分割

  • train: 训练集,包含123,911,229个样本,总大小为15,162,994,840字节。

数据集大小

  • 下载大小: 4,535,255,991字节
  • 数据集大小: 15,162,994,840字节

配置

  • default: 默认配置,包含训练集数据文件路径为data/train-*

标签

  • timeseries: 时间序列
  • economics: 经济学

数据集描述

时间范围

  • 数据集包含720天以上的历史股票数据,时间间隔为1小时。

数据内容

  • 数据包括完整的蜡烛图数据(开盘价、收盘价、最低价、最高价)以及交易量数据。
  • 所有数据值以美元为单位。

数据集用途

  • 时间序列预测
  • 金融建模
  • 强化学习

数据集限制

  • 数据集的时间跨度相对较短(约2年)。
  • 由于经济数据的偏差控制困难,模型可能偏向于近期市场趋势。
  • 数据可能存在缺失、不正确或不可靠的情况,建议在使用前进行验证。

数据集创建

  • 数据来源主要为Yahoo Finance网站。
  • 数据收集和处理使用yfinance库完成。
  • 数据收集和处理过程完全由个人硬件完成。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作