five

1s-crypto-data

收藏
Hugging Face2026-04-12 更新2026-04-13 收录
下载链接:
https://huggingface.co/datasets/commanderzee/1s-crypto-data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从Binance Vision下载的六种主要加密货币的1秒K线(OHLCV)历史数据,每日更新,延迟不超过24小时。数据集涵盖BTCUSDT、ETHUSDT、BNBUSDT、XRPUSDT、DOGEUSDT和SOLUSDT六种资产,每种资产的数据从2019年或2020年开始记录。数据以Parquet格式存储,每个资产一个文件,包含以下字段:open_time_s(Unix时间戳,秒)、open(1秒开盘价)、high(1秒最高价)、low(1秒最低价)、close(1秒收盘价)和volume(基础资产成交量)。数据集适用于时间序列预测、加密货币市场分析等任务。用户可以通过提供的Python脚本每日自动更新数据。所有数据均来自Binance Vision的公开存档,时间戳已标准化为Unix秒,并去除了重复的K线。
创建时间:
2026-04-08
搜集汇总
数据集介绍
main_image_url
构建方式
在加密货币高频交易研究领域,数据质量与时效性至关重要。该数据集通过自动化流程从币安官方数据门户Binance Vision系统性地获取原始数据,涵盖了六种主流加密货币自2019年以来的每秒K线数据。数据以Parquet格式存储,每个资产对应单一文件,并通过每日更新脚本自动检测并追加最新的交易日数据,确保数据集始终与源头保持同步,滞后时间不超过24小时。
特点
该数据集的核心特征在于其极高的时间分辨率与完整性,提供了每秒级别的开盘价、最高价、最低价、收盘价及成交量数据,为微观市场结构分析提供了坚实基础。数据集覆盖了BTCUSDT、ETHUSDT等六种关键加密资产,时间跨度长达数年,数据规模庞大,单个文件可达数亿行。所有时间戳已统一转换为秒级Unix整数,并经过去重与排序处理,保证了数据的整洁性与一致性。
使用方法
研究人员可利用Pandas库直接加载Parquet文件进行高效分析,支持按资产加载完整历史数据或批量处理所有资产。数据集附带的Python更新脚本支持手动或自动执行,用户可通过设置环境变量与命令行参数实现定制化数据同步,例如仅更新特定币种或进行模拟运行。这为构建实时监控系统、回测高频交易策略或训练时间序列预测模型提供了便捷且可靠的数据管道。
背景与挑战
背景概述
在金融时间序列分析领域,高频数据为揭示市场微观结构提供了关键洞察。1s-crypto-data数据集由研究人员或机构基于Binance Vision公开档案构建,专注于加密货币市场,收录了自2019年起六种主要加密货币的每秒K线数据。该数据集的核心研究问题在于支持对加密资产价格行为的超高频分析,为算法交易、波动性建模及市场效率研究提供精细化数据基础,对推动量化金融与计算金融学的前沿探索具有显著影响力。
当前挑战
该数据集旨在解决加密货币领域超高频时间序列预测与分析的挑战,包括捕捉秒级市场动态、处理高噪声数据以及建模非线性价格模式。在构建过程中,面临数据规模庞大带来的存储与计算压力,需高效处理每秒数亿行数据;同时,确保数据更新的时效性与一致性,每日从分布式源端同步并整合新数据,避免重复或缺失,构成了持续的技术挑战。
常用场景
经典使用场景
在金融时间序列分析领域,高频数据对于捕捉市场微观结构至关重要。1s-crypto-data数据集提供了六种主要加密货币的每秒OHLCV数据,其经典使用场景在于支持高频交易策略的研发与回测。研究人员利用这一秒级精度的时间序列,能够深入分析价格在极短时间窗口内的波动模式、流动性变化以及市场事件的即时反应,为量化金融模型提供了前所未有的细粒度观测基础。
实际应用
在实际应用层面,该数据集直接服务于算法交易与风险管理系统的构建。交易机构可利用秒级数据优化高频做市策略、执行智能订单路由以及实时监控市场异常。风控部门则能基于更密集的数据点,更准确地计算在险价值(VaR)和预测极端行情下的潜在损失,从而增强数字资产投资组合的稳健性。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在深度学习与强化学习在超高频预测中的应用。例如,基于Transformer或时序卷积网络(TCN)的模型被设计用于秒级价格走势预测。此外,该数据也催生了针对加密货币市场微观结构的研究,如订单流不平衡的秒级分析、闪电崩盘的早期预警系统构建,以及去中心化金融(DeFi)与传统中心化交易所间套利机会的瞬时识别算法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作