kraken-trading-data
收藏Hugging Face2024-12-20 更新2024-12-21 收录
下载链接:
https://huggingface.co/datasets/GotThatData/kraken-trading-data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从Kraken交易所收集的加密货币交易数据,涵盖实时价格、交易量和订单簿数据。主要交易对包括比特币/美元、以太坊/美元、瑞波币/美元等。数据字段包括时间戳、交易对标识符、最后交易价格、24小时交易量、最佳买卖价格、24小时最低和最高价格、成交量加权平均价格以及交易数量。数据集被分为训练、验证和测试集,每个集包含不同数量的数据点。数据收集过程使用Kraken的公共API,每2秒收集一次数据,并自动处理API速率限制和错误日志记录。
创建时间:
2024-12-18
原始信息汇总
Kraken Trading Data Collection
概述
该数据集包含从Kraken交易所收集的加密货币交易数据,包括实时价格、交易量和订单簿数据,涵盖主要加密货币交易对。
数据描述
包含的交易对
- XXBTZUSD (比特币/美元)
- XETHZUSD (以太坊/美元)
- XXRPZUSD (瑞波币/美元)
- ADAUSD (卡尔达诺/美元)
- DOGEUSD (狗狗币/美元)
- BNBUSD (币安币/美元)
- SOLUSD (索拉纳/美元)
- DOTUSD (波卡/美元)
- MATICUSD (多边形/美元)
- LTCUSD (莱特币/美元)
数据字段
- timestamp: 数据收集的UTC时间戳
- pair: 交易对标识符
- price: 最后交易价格
- volume: 24小时交易量
- bid: 最佳买价
- ask: 最佳卖价
- low: 24小时最低价
- high: 24小时最高价
- vwap: 成交量加权平均价格
- trades: 交易数量
数据分割
- 训练集: 每个交易对1000个数据点
- 验证集: 每个交易对200个数据点
- 测试集: 每个交易对200个数据点
数据收集过程
- 使用Kraken的公共API收集数据
- 收集频率: 每2秒一个数据点
- 自动处理API速率限制
- 全面的错误日志记录
- 数据验证和清理
重要注意事项
- API凭证文件
kraken.key不应共享或提交到仓库 - 注意Kraken的API速率限制
- 所有时间戳均为UTC时间
日志记录
脚本会创建一个日志文件kraken_data_collection.log,包含:
- 数据收集进度
- 错误信息
- 数据摘要统计
许可证
MIT许可证
引用
如果使用此数据集进行研究,请引用:
@dataset{kraken_trading_data, author = {GotThatData}, title = {Kraken Trading Data Collection}, year = {2024}, publisher = {Hugging Face}, url = {https://huggingface.co/datasets/GotThatData/kraken-trading-data} }
搜集汇总
数据集介绍

构建方式
该数据集通过Kraken交易所的公开API进行构建,涵盖了主要加密货币对的实时价格、交易量及订单簿数据。数据采集频率为每2秒一个数据点,确保了数据的实时性和连续性。此外,数据集还包含了自动处理API速率限制、全面的错误日志记录以及数据验证和清洗等功能,以确保数据的准确性和可靠性。
特点
该数据集的显著特点在于其涵盖了多种主流加密货币的交易数据,包括比特币、以太坊、瑞波币等。每个交易对的数据字段详尽,涵盖了时间戳、交易价格、交易量、最佳买卖价格、24小时高低价格以及成交量加权平均价格等关键指标。此外,数据集还提供了训练、验证和测试三个子集,便于模型训练和评估。
使用方法
使用该数据集时,用户需先克隆仓库并安装所需的Python包。随后,通过运行数据收集脚本,用户可以生成包含训练、验证和测试数据的CSV文件。这些文件分别存储在相应的目录中,便于后续的数据分析和模型训练。值得注意的是,用户需自行创建包含Kraken API凭证的文件,并确保不将其公开或提交至仓库,以维护数据的安全性。
背景与挑战
背景概述
随着加密货币市场的迅速发展,对实时交易数据的分析需求日益增长。Kraken Trading Data数据集由GotThatData团队于2024年创建,旨在为研究人员和开发者提供来自Kraken交易所的加密货币交易数据。该数据集涵盖了比特币、以太坊、瑞波币等主要加密货币的交易对,包括实时价格、交易量、订单簿等关键数据字段。通过提供详细的交易数据,该数据集为时间序列预测、市场分析和算法交易等领域的研究提供了宝贵的资源,极大地推动了加密货币交易领域的研究进展。
当前挑战
Kraken Trading Data数据集在构建过程中面临多项挑战。首先,加密货币市场的波动性极高,数据采集的实时性和准确性至关重要。其次,Kraken交易所的API存在严格的速率限制,如何在数据采集过程中有效管理这些限制并确保数据的连续性是一个技术难题。此外,数据清洗和验证也是一大挑战,确保数据的质量和一致性对于后续分析至关重要。最后,如何在保护用户隐私和遵守交易所规定的前提下,安全地存储和使用API密钥,也是数据集构建过程中需要解决的重要问题。
常用场景
经典使用场景
在金融科技领域,kraken-trading-data数据集被广泛应用于加密货币市场的实时价格预测与交易策略优化。该数据集通过收集Kraken交易所的实时价格、交易量、订单簿等关键数据,为研究人员提供了丰富的市场动态信息。经典的使用场景包括构建时间序列预测模型,分析市场波动性,以及设计高频交易算法。
解决学术问题
kraken-trading-data数据集为解决加密货币市场的价格预测、市场微观结构分析以及交易策略优化等学术问题提供了重要支持。通过提供高频、实时的交易数据,该数据集使得研究人员能够深入探索市场动态,验证各种金融理论模型,并为市场参与者提供科学的决策依据。
衍生相关工作
基于kraken-trading-data数据集,研究者们开展了多项经典工作,包括加密货币市场的价格预测模型、市场微观结构分析以及高频交易算法的设计与优化。这些工作不仅推动了金融科技领域的研究进展,还为实际交易系统的设计提供了理论支持,进一步促进了加密货币市场的健康发展。
以上内容由遇见数据集搜集并总结生成



