casinodataxd
收藏Hugging Face2026-04-03 更新2026-04-04 收录
下载链接:
https://huggingface.co/datasets/0xKai/casinodataxd
下载链接
链接失效反馈官方服务:
资源简介:
nocryinginthecasino市场数据是一个专注于实时加密货币市场数据的开源数据集,涵盖了69个交易场所的7种加密货币(BTC、ETH、SOL、LTC、XRP、SUI、BNB)。数据集包含多种数据类型,如原始交易记录、1秒/1分钟/1小时的OHLCV+delta条形数据、清算事件、全球清算量、资金费率、稳定币事件(铸造/销毁/冻结)、XRP生命周期事件、Solana和SUI的链上事件、Litecoin的链上事件、LTC内存池统计、LTC网络统计和LTC富豪榜快照,以及带有情感分析的新闻文章。数据集以Parquet文件格式按小时分区存储,所有时间戳均为UTC时间戳(自纪元以来的毫秒数)。数据持续从实时TimescaleDB实例同步,每小时更新一次。该数据集适用于时间序列预测、加密货币交易分析、市场情绪研究等任务。
创建时间:
2026-04-03
原始信息汇总
nocryinginthecasino Market Data 数据集概述
数据集基本信息
- 数据集名称:nocryinginthecasino Market Data
- 许可证:cc-by-4.0
- 任务类别:时间序列预测
- 标签:加密货币、交易、市场数据、清算、资金费率、新闻情绪、稳定币、XRP
数据来源与范围
- 数据来源于69个交易场所的实时加密货币市场数据。
- 涵盖7种交易符号:BTC、ETH、SOL、LTC、XRP、SUI、BNB。
数据配置与结构
数据集包含以下配置,数据文件均为Parquet格式,按小时分区。
| 配置名称 | 描述 | 关键列 |
|---|---|---|
| trades | 原始交易点 | time, symbol, venue, price, qty, notional, is_buy |
| bars_1s | 每秒OHLCV+delta柱状图(按交易场所) | bucket, symbol, venue, OHLCV, delta, delta_high, delta_low |
| bars_1m | 每分钟OHLCV+delta柱状图(按交易场所) | bucket, symbol, venue, OHLCV, delta, delta_high, delta_low |
| bars_1h | 每小时OHLCV+delta柱状图(按交易场所) | bucket, symbol, venue, OHLCV, delta, delta_high, delta_low |
| liquidations | 单个清算事件 | ts, symbol, venue, side, price, qty, notional |
| global_liq_bars | 全局清算量(所有符号) | bucket, resolution, long_vol, short_vol |
| funding | 资金费率 + 未平仓合约快照 | ts, symbol, venue, rate, oi_usd, mark_price, premium_percent |
| stable_events | 稳定币铸造/销毁/冻结事件 | ts, symbol, event_type, amount, tx_hash |
| xrp_events | XRP生命周期事件 | ts, event_type, account, amount_xrp, tx_hash |
| sol_events | Solana链上事件 | ts, event_type, program, symbol, amount, signature |
| sui_events | SUI链上事件 | ts, event_type, symbol, amount, tx_digest |
| ltc_chain_events | 莱特币链上事件 | ts, event_type, amount_ltc, tx_hash, from_addr, to_addr |
| ltc_mempool_stats | LTC内存池样本(30秒) | ts, mempool_count, total_fee_litoshis, fastest_fee |
| ltc_network_stats | LTC网络快照(每小时) | ts, hashrate, difficulty, block_height, market_price_usd |
| ltc_rich_list | LTC富豪榜快照(每日) | ts, rank, address, balance_ltc, entity |
| articles | 带有情绪的新闻文章 | published_at, title, feed_name, sentiment, sentiment_score |
数据使用
可通过 datasets 库加载数据集,示例如下:
python
from datasets import load_dataset
trades = load_dataset("casinodataxd", "trades")
bars = load_dataset("casinodataxd", "bars_1h")
funding = load_dataset("casinodataxd", "funding")
数据时间与更新
- 时间戳格式:所有时间戳均为自纪元(UTC)以来的int64毫秒数。
- 更新计划:数据从实时TimescaleDB实例持续同步,所有数据每小时上传一次。
搜集汇总
数据集介绍

构建方式
在加密货币市场数据领域,该数据集通过实时同步来自69个交易场所的多元信息流构建而成。其核心机制依托于TimescaleDB实例的持续数据流捕获,以小时为粒度对原始交易记录、链上事件及新闻资讯进行系统化抽取与整合。数据采集覆盖了七种主流数字资产,并采用分表存储策略,将不同维度的市场信号——如逐笔成交、分钟级K线、清算事件与资金费率——分别封装为独立的Parquet文件,确保了数据结构的高效性与可扩展性。
特点
该数据集的显著特征在于其多维度的市场观测体系与精细的时间分辨率。它不仅提供了秒级至小时级的OHLCV价格序列,还深度融合了链上事件、稳定币动态、清算流量以及新闻情感分析等多源信号。每种资产均配备独立的链上事件追踪模块,例如XRP的生命周期事件与Litecoin的链上统计,形成了横跨交易市场与区块链底层的立体数据网络。所有时间戳均采用UTC毫秒纪元格式,保障了跨时区分析的一致性。
使用方法
使用者可通过HuggingFace Datasets库便捷加载数据集的特定配置模块。例如调用load_dataset函数并指定'casinodataxd'与对应配置名称(如'trades'或'funding'),即可获取按小时分区的结构化数据表。数据集支持直接进行时间序列预测、市场微观结构分析或跨因子研究,各表的关键字段如时间戳、资产符号、交易场所等均已标准化,便于与主流量化分析框架对接。数据按小时持续更新,适合构建实时的市场监测与回测系统。
背景与挑战
背景概述
随着加密货币市场的快速发展,对高频、多维度市场数据的需求日益增长。casinodataxd数据集由nocryinginthecasino团队构建,旨在提供实时、全面的加密货币市场数据,涵盖交易、清算、资金费率、链上事件及新闻情感等多个维度。该数据集整合了来自69个交易场所的7种主要加密货币数据,其核心研究问题聚焦于如何通过多源异构数据的融合,支持时间序列预测、市场微观结构分析及风险建模等高级金融研究。自发布以来,该数据集为量化交易、市场监测及区块链分析领域提供了重要的数据基础设施,推动了加密货币实证研究的深化。
当前挑战
在加密货币领域,市场预测与风险管理的核心挑战在于数据的高噪声、非平稳性及多市场异质性。casinodataxd数据集致力于解决这些挑战,通过整合交易、清算、链上活动等多模态数据,为复杂市场行为的建模提供基础。然而,数据构建过程中面临显著困难:实时数据同步需处理不同交易所的API速率限制与数据格式差异;多源数据的时序对齐与清洗涉及大量计算资源;链上事件解析要求对区块链协议有深入理解,以确保数据的准确性与一致性。这些技术障碍使得构建一个统一、可靠的高频数据集成为一项艰巨任务。
常用场景
经典使用场景
在加密货币市场分析领域,casinodataxd数据集以其多维度的实时市场数据,为时间序列预测研究提供了经典的应用场景。该数据集整合了69个交易场所的原始交易数据、分钟级OHLCV柱状图、清算事件、资金费率以及链上事件,使得研究者能够构建复杂的预测模型,以分析价格波动、市场流动性及风险传染效应。通过融合高频交易数据与新闻情感分析,该数据集支持对市场微观结构进行深入探索,为量化交易策略的开发和验证奠定了数据基础。
解决学术问题
该数据集有效解决了加密货币研究中数据碎片化与质量参差不齐的学术难题。通过提供统一格式的多源异构数据,包括交易、清算、资金费率及链上活动,研究者能够系统性地检验市场效率假说、评估杠杆交易的系统性风险,并探究稳定币事件对资产价格的冲击。其高频率的时间戳与跨符号覆盖,为构建精确的因果推断模型和风险预警机制提供了可靠支撑,显著推动了数字资产金融学的前沿进展。
衍生相关工作
基于casinodataxd数据集,学术界与工业界衍生了一系列经典研究工作。例如,利用其多分辨率柱状图数据,研究者开发了基于深度学习的价格预测模型,显著提升了短期波动率估计的准确性;结合清算与资金费率模块,多项研究揭示了杠杆交易与市场崩盘间的动态关联。此外,该数据集还支撑了关于稳定币机制稳定性的实证分析,以及跨链事件对资产价格影响的因果研究,为加密货币市场的理论建模与政策制定提供了关键实证基础。
以上内容由遇见数据集搜集并总结生成



