dex-swaps
收藏Hugging Face2026-05-16 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/Chainticks/dex-swaps
下载链接
链接失效反馈官方服务:
资源简介:
Chainticks DEX Swaps 是一个从公共 EVM 链日志解码的标准化去中心化交易所(DEX)交换事件数据集。数据以 Parquet 格式存储,按日期分区(例如 swaps/date=YYYY-MM-DD/part-0000.parquet),便于高效查询和处理。数据集包含链上事件记录,每行数据的 source_kind 字段均为 on_chain_event,确保数据源自区块链日志,而不包括场所 REST/API 转售数据。数据集提供 _schema.json 文件定义数据结构,_manifest.json 和 LATEST_DATE.txt 文件用于元数据管理和跟踪最新数据日期。该数据集适用于金融和加密货币领域的分析任务,如市场上下文构建、交易模式研究或代理智能体下游分析,支持使用 pandas、DuckDB、Polars 等工具进行处理。Chainticks 作为独立实体,与数据所涉及的协议、中继、场所或政府机构无关联。
Chainticks DEX Swaps is a standardized decentralized exchange (DEX) swap events dataset decoded from public EVM chain logs. The data is stored in Parquet format, partitioned by date (e.g., swaps/date=YYYY-MM-DD/part-0000.parquet), facilitating efficient querying and processing. The dataset contains on-chain event records, with each rows source_kind field set to on_chain_event, ensuring the data originates from blockchain logs and excludes venue REST/API resale data. It includes _schema.json for data structure definition, and _manifest.json and LATEST_DATE.txt files for metadata management and tracking the latest data date. This dataset is suitable for financial and cryptocurrency analysis tasks, such as market context construction, trading pattern research, or downstream analysis for agent intelligence, supporting tools like pandas, DuckDB, and Polars. Chainticks is an independent entity with no affiliation to protocols, relays, venues, or government agencies involved in the data.
创建时间:
2026-05-11
搜集汇总
数据集介绍

构建方式
Chainticks DEX Swaps 数据集源于对公开EVM链上日志中DEX互换事件的解码与归一化处理。数据以Parquet格式存储,按日期分区组织在`swaps/date=YYYY-MM-DD/`目录下,每个分区包含`part-0000.parquet`文件。此外,数据集还附带`_schema.json`用于描述字段结构,`_manifest.json`记录元信息,以及`LATEST_DATE.txt`指示最新数据日期。每一行数据均需满足`source_kind`为`on_chain_event`,确保数据来源为链上事件,而非第三方API的中继数据。
使用方法
使用数据集时,首先从`LATEST_DATE.txt`获取最新日期,并查阅`_schema.json`了解字段结构。随后可直接通过Parquet路径加载所需日期的数据,例如使用`pd.read_parquet(URL)`读取指定日期的`part-0000.parquet`文件。在分析中,应将时间戳视为UTC时间,并保留`source_kind`字段以维护数据来源的完整性。该数据集设计为仅追加,适用于构建时间序列模型或市场分析管道的增量输入。
背景与挑战
背景概述
随着去中心化金融(DeFi)生态的蓬勃发展,链上交易数据的标准化与可访问性成为推动金融科技研究的关键瓶颈。由独立研究团队Chainticks于近期创建的dex-swaps数据集,旨在解决去中心化交易所(DEX)交换事件数据的碎片化问题。该数据集系统性地解码并归一化了来自公开EVM链日志的交换事件,为研究市场微观结构、流动性动态及链上交易策略提供了高保真、易于程序化访问的基础资源。其采用Parquet格式并支持日期分区,显著提升了大规模数据分析的效率,在加密货币金融研究领域具有重要的开源基础设施价值。
当前挑战
该数据集面临的核心挑战首先在于处理异构链上事件的复杂性问题——不同DEX协议的事件结构差异巨大,如何设计统一的数据模型以兼容各类路由、费用与交易类型,同时保持字段的语义一致性,是技术实现的首要难题。其次,构建过程中需应对区块链数据的时序一致性与不可逆性问题,包括应对链重组导致的记录过期、缺失事件以及交易回滚时数据状态的同步。此外,数据集以增量更新的方式发布,如何在不破坏现有查询的前提下保持数据集的附带式追加特性,并确保用户能够精确追踪数据源的版本与回放边界,亦是维护中的关键挑战。
常用场景
经典使用场景
在去中心化金融(DeFi)生态蓬勃发展的浪潮中,dex-swaps数据集作为标准化链上交换事件的核心记录源,其经典应用场景聚焦于对去中心化交易所(DEX)交易行为的量化分析与模式挖掘。研究人员可借助该数据集,通过解析时间序列中的交换频次、交易对分布及资金流动轨迹,精准刻画DEX市场的流动性特征与用户交易偏好,为构建高效的市场微观结构模型提供坚实的数据基底。
解决学术问题
dex-swaps数据集有效破解了区块链数据异构性带来的研究壁垒,解决了从原始链上日志中高效提取并归一化DEX交换事件这一关键学术难题。它使得学者能够围绕去中心化市场中的价格发现机制、流动性池动态博弈、智能路由策略效能评估以及MEV(矿工可提取价值)影响等前沿议题开展系统性探究,显著推动了DeFi经济学与加密金融实证研究的理论深化与范式创新。
实际应用
在实际应用层面,dex-swaps数据集为智能投顾系统的回测引擎提供了不可或缺的历史市场状态输入,助力开发者验证质押策略、套利算法与对冲方案的稳健性。同时,它支撑着风险监控平台的实时告警逻辑,通过追溯异常大额交换事件与跨协议资金流,为DeFi协议审计、监管合规追踪及链上欺诈检测等实务场景注入了高保真的数据驱动决策能力。
数据集最近研究
最新研究方向
当前,随着去中心化金融(DeFi)生态的蓬勃演进,链上交易数据的标准化与可访问性成为市场微观结构研究的关键突破口。dex-swaps数据集通过规范化处理EVM公链上的去中心化交易所(DEX)兑换事件,为高频交易分析、流动性池动态监测以及MEV攻击模式识别提供了高保真的数据底座。其采用Parquet列式存储与分区布局,兼顾了大规模并行查询效率,尤其适合与DuckDB、Polars等现代分析引擎协同,支撑时序性市场异常检测与跨链套利策略回溯。该数据集独立于具体协议,强调仅收录链上事件源,摒弃二次聚合数据,这为量化流动性提供者行为、评估滑点波动及追踪闪电贷关联交易树提供了纯净的观测窗口。在DeFi监管讨论日益升温的语境下,此类公开的、可复现的规范化链上数据资源,正成为联结学术研究、风险建模与合规审计的关键基础设施。
以上内容由遇见数据集搜集并总结生成



