stablecoin-flows
收藏Hugging Face2026-05-16 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/Chainticks/stablecoin-flows
下载链接
链接失效反馈官方服务:
资源简介:
Chainticks Stablecoin Flows 是一个专注于加密货币稳定币流动分析的数据集,旨在提供基于公共区块链数据的USDC和USDT代币的铸造、销毁及跨链桥流动记录。该数据集从公开的ERC-20转移日志中衍生而来,以结构化的行数据形式呈现,每条数据均标记为链上事件(source_kind=on_chain_event),明确排除了来自交易所或API的转售数据。数据以Parquet格式存储,并按日期分区组织(如flows/date=YYYY-MM-DD/),便于高效查询和处理。数据集包含模式定义文件(_schema.json)、清单文件(_manifest.json)以及最新日期指示文件(LATEST_DATE.txt),支持使用pandas、DuckDB或Polars等工具进行加载和分析。其主要应用场景包括加密货币市场研究、链上流动性监控、金融智能体上下文构建以及去中心化金融(DeFi)分析,要求使用者将时间戳视为UTC时间并在下游分析中保留数据来源类型字段。数据集采用CC-BY-4.0许可,由独立机构Chainticks维护,与所涉协议或机构无附属关系。
Chainticks Stablecoin Flows is a dataset focused on analyzing stablecoin flows in cryptocurrencies, aiming to provide records of USDC and USDT token minting, burning, and cross-chain bridge movements based on public blockchain data. Derived from public ERC-20 transfer logs, it is presented in structured row data format, with each entry marked as an on-chain event (source_kind=on_chain_event), explicitly excluding resale data from exchanges or APIs. The data is stored in Parquet format and organized by date partitions (e.g., flows/date=YYYY-MM-DD/) for efficient querying and processing. The dataset includes schema definition files (_schema.json), manifest files (_manifest.json), and a latest date indicator file (LATEST_DATE.txt), supporting loading and analysis with tools like pandas, DuckDB, or Polars. Its main applications include cryptocurrency market research, on-chain liquidity monitoring, financial agent context building, and decentralized finance (DeFi) analysis, requiring users to treat timestamps as UTC time and retain data source type fields in downstream analysis. The dataset uses the CC-BY-4.0 license and is maintained by the independent organization Chainticks, with no affiliation to the involved protocols or institutions.
创建时间:
2026-05-11
搜集汇总
数据集介绍

构建方式
该数据集源自公开的ERC-20代币转移日志,通过系统性地解析链上事件,提取与USDC和USDT相关的铸造(mint)、销毁(burn)及跨链桥转账(bridge flow)交易记录。数据以Parquet格式按日期分区存储于HuggingFace平台,每个分区文件对应特定日期的交易快照。构建过程中严格限定数据来源类型(source_kind)为链上事件(on_chain_event),以确保数据源的纯正性与可追溯性,避免引入第三方API或中心化交易所的二次销售数据。
使用方法
用户可通过Pandas、DuckDB或Polars等工具直接加载特定日期的Parquet分区文件,例如使用`pd.read_parquet(URL)`读取指定日期的数据块。建议先读取LATEST_DATE.txt获取最新数据日期,并查阅_schema.json理解字段定义。数据应仅作为追加型市场背景信息使用,适用于稳定币流动监控、跨链活动分析等金融时序研究场景。下游分析中需保持时间戳的UTC一致性,并保留source_kind字段以区分数据来源类型。
背景与挑战
背景概述
在加密货币与传统金融市场日益融合的当下,稳定币作为连接两大生态的桥梁,其流动模式对于理解市场动态与金融风险具有关键意义。Chainticks Stablecoin Flows数据集由独立的Chainticks机构于近年创建,旨在从公开的ERC-20转账日志中提取USDC和USDT的铸造、销毁及跨链桥流量。该数据集以每日Parquet分区形式发布,并支持Agent友好的自动读取接口,为核心研究问题——即如何大规模、可复现地追踪稳定币的跨生态系统流动——提供了开创性的数据基础。凭借其精细化的设计与严格的来源校准(仅采用链上事件源),该数据集已迅速成为加密金融领域进行流动性分析、市场微观结构研究以及系统性风险建模的重要资源。
当前挑战
该数据集所面对的领域问题挑战在于:稳定币流动性数据的碎片化与不透明性长期困扰着金融研究者,尤其是跨链桥交易记录的混杂与中心化交易所API的限制,使得精确追踪稳定币的实际流通量变得极为困难。在数据构建过程中,Chainticks团队遇到了从海量ERC-20日志中准确过滤并标准化USDC/USDT相关事件的技术难题,例如处理重复交易、不同协议间的命名差异以及时间戳的一致性校准。此外,保持数据集的实时性与历史数据回溯的完整性之间需要精细平衡,同时确保所有数据行严格遵守“仅限链上事件”的溯源政策,以避免混入第三方的API转售数据,从而维护数据纯净度与学术可靠性。
常用场景
经典使用场景
在加密货币与去中心化金融(DeFi)领域,稳定币作为连接传统金融与加密世界的桥梁,其流动模式对市场稳定性和系统性风险具有深刻影响。Chainticks Stablecoin Flows数据集基于公开的ERC-20转账日志,精心提取了USDC与USDT的铸造(mint)、销毁(burn)及跨链桥接(bridge)等核心操作数据。该数据集最经典的使用场景在于追踪主流稳定币在链上的净流量变化,研究人员可借此分析资金在不同区块链网络间的迁徙路径,识别套利机会与流动性聚集效应,从而揭示加密生态系统内部的资本流动规律。
解决学术问题
该数据集解决了区块链金融研究中长期存在的数据碎片化与透明度不足问题。传统上,学术界在分析稳定币市场时依赖于中心化交易所的成交量数据或价格序列,难以捕捉链上原生行为。通过提供标准化、可分区的Parquet格式数据,Chainticks使得研究者能够系统性地探索稳定币供应量变动与市场波动率、交易所储备率之间的动态关联。这对于理解Tether与USDC的发行机制如何影响加密资产价格发现、评估跨链桥接协议的效率以及度量算法稳定币的锚定风险,具有不可替代的实证价值,推动了加密经济学的定量化研究范式。
实际应用
在实际应用中,该数据集为量化交易与风险管理平台提供了实时且可靠的链上流动性监测工具。金融机构与做市商可利用每日更新的铸造与销毁记录,构建稳定币供需模型,优化跨链套利策略的动态执行。此外,监管科技公司能够通过分析大规模赎回事件(如UST崩盘期间的USDC流出),开发早期预警系统以识别潜在的金融传染信号。数据集的Parquet分区设计使得Hadoop生态与Spark引擎可无缝接入,支持高频回测与在线学习场景,显著降低了私有爬取链上数据的运维成本。
数据集最近研究
最新研究方向
随着加密货币市场日益成熟,稳定币作为连接传统金融与数字资产的桥梁,其流动模式已成为金融科技研究的前沿热点。该数据集聚焦于USDC与USDT两大主流稳定币的铸币、销毁及跨链桥转移活动,基于公开的ERC-20转账日志构建,为解析链上资本流动、市场情绪演变及去中心化金融风险传导提供了高精度分析基础。在当前全球监管趋严与DeFi生态扩张的背景下,该数据支持研究者追踪稳定币供应量的动态变化,识别套利行为与流动性冲击的微观特征,进而推动对加密货币市场系统性风险的量化建模。其按日期分区的Parquet格式与轻量级访问接口,显著降低了高频金融数据研究的门槛,有望促进学界与业界在数字资产价格形成机制及宏观顺周期性等议题上的实证突破。
以上内容由遇见数据集搜集并总结生成



