hikitoxin/bigstock-1h-sample
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/hikitoxin/bigstock-1h-sample
下载链接
链接失效反馈官方服务:
资源简介:
BigStock数据集包含79个股票符号的历史数据,时间跨度为720多天,数据间隔为一小时。所有数据以美元计价,包括完整的蜡烛图数据(开盘价、收盘价、最低价、最高价)以及交易量数据。数据集的主要用途包括时间序列预测、金融建模和强化学习。数据集的局限性在于其时间跨度较短(约2年),且可能存在缺失、错误或不可靠的数据。数据集的数据来源于Yahoo Finance网站,使用yfinance库进行收集和处理。
This dataset contains historical data for a sample of 79 stock symbols. The data spans a period of 720+ days, at one-hour intervals. All values are in USD. It includes full candlestick data (open, close, low, high) as well as volume data. The dataset is divided into a training set with 270846 samples. It is suitable for tasks such as time series forecasting, financial modeling, and reinforcement learning, but has limitations in short-term data and potential market trend biases. The data is sourced from Yahoo Finance and collected using the yfinance library.
提供机构:
hikitoxin
原始信息汇总
BigStock 数据集概述
数据集信息
- 特征:
timestamp: 时间戳,字符串类型ticker: 股票代码,字符串类型open: 开盘价,浮点数类型high: 最高价,浮点数类型low: 最低价,浮点数类型close: 收盘价,浮点数类型volume: 交易量,整数类型source: 数据来源,字符串类型retreived: 数据获取时间,字符串类型
- 分割:
train: 训练集,包含 270,846 个样本,32,020,428 字节
- 下载大小: 12,429,410 字节
- 数据集大小: 32,020,428 字节
- 配置:
default: 默认配置,包含训练集数据文件
- 许可证: GPL v3.0
- 任务类别: 时间序列预测
- 名称: BigStock
- 标签: 时间序列, 经济学
数据集描述
- 历史数据: 包含 79 个股票代码的历史数据
- 时间跨度: 720+ 天,每小时间隔
- 货币单位: 所有值以美元为单位
- 数据类型: 包含完整的蜡烛图数据(开盘价、收盘价、最低价、最高价)以及交易量数据
其他数据集
- BigStock 完整版: 包含最多 103,000 个符号(包括股票、期货、期权、加密货币等)和 17 亿行数据
- BigStock-1m: 正在开发中,以一分钟为粒度,覆盖 30 天的时间跨度
用途
- 时间序列预测
- 金融建模
- 强化学习
限制
- 时间跨度: 数据相对较短,约 2 年
- 偏差: 由于数据仅来自一个市场,模型可能偏向于近期市场趋势
- 数据质量: 数据可能存在缺失、错误或不可靠的情况,建议在使用前进行验证
数据集创建
- 数据来源: 样本数据来自 Yahoo Finance 网站
- 数据收集工具: 使用 yfinance 库进行数据收集和处理
- 硬件: 数据收集和处理完全在个人拥有的硬件上进行
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



