defi-liquidations
收藏Hugging Face2026-05-16 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/Chainticks/defi-liquidations
下载链接
链接失效反馈官方服务:
资源简介:
Chainticks DeFi Liquidations 是一个标准化的去中心化金融(DeFi)清算事件数据集,数据来源于公共区块链日志的解码。该数据集以 Parquet 文件格式存储,按日期分区组织(例如 liquidations/date=YYYY-MM-DD/),便于高效查询和处理。每个分区包含多个 Parquet 文件(如 part-0000.parquet),并附带元数据文件:_schema.json 定义数据模式,_manifest.json 提供文件清单,LATEST_DATE.txt 指示最新数据日期。数据行严格限定为 source_kind 字段值为 on_chain_event 的记录,确保数据源自链上事件,不包括场所 REST/API 转售数据。数据集适用于金融和加密货币领域的研究与分析,可作为追加式市场上下文,支持使用 pandas、DuckDB 或 Polars 等工具进行数据处理。使用时需注意时间戳为 UTC 时区,并应在下游分析中保留 source_kind 字段以追踪数据来源。Chainticks 为独立实体,与数据所涉及的协议、中继、场所或政府机构无关联。
Chainticks DeFi Liquidations is a standardized decentralized finance (DeFi) liquidation event dataset, with data derived from decoded public blockchain logs. This dataset is stored in Parquet file format and organized via date-based partitioning (e.g., liquidations/date=YYYY-MM-DD/) to facilitate efficient querying and processing. Each partition contains multiple Parquet files (such as part-0000.parquet), and is accompanied by metadata files: _schema.json defines the data schema, _manifest.json provides the file manifest, and LATEST_DATE.txt indicates the latest data date. Data rows are strictly restricted to records where the source_kind field has a value of on_chain_event, ensuring that all data originates from on-chain events and excludes data resold via REST/API interfaces from trading venues. This dataset is suitable for research and analysis in the finance and cryptocurrency fields, and can serve as appendable market context to support data processing with tools including pandas, DuckDB, or Polars. When using the dataset, please note that all timestamps are in UTC timezone, and the source_kind field should be retained in downstream analyses to trace the data provenance. Chainticks is an independent entity and has no affiliation with any protocols, relays, trading venues, or government agencies associated with the dataset.
创建时间:
2026-05-11
搜集汇总
数据集介绍

构建方式
该数据集由Chainticks团队构建,专注于从公开的链上日志中解码并归一化DeFi清算事件。数据以Parquet格式存储,按日期分区组织,每个分区包含该日期的所有清算记录。数据来源明确标注为链上事件(on_chain_event),确保了数据的原始性和可追溯性。此外,数据集中包含_schema.json和_manifest.json文件,便于用户理解数据结构,而LATEST_DATE.txt则提供了最新数据日期的快速索引。
特点
数据集具有高度的结构化和标准化特性,所有清算事件均经过归一化处理,确保字段一致性和跨协议的兼容性。数据以Parquet格式存储,支持高效列式查询和压缩。数据集特别强调友好性,支持Pandas、Polars、DuckDB等流行数据处理库,并针对AI代理场景进行了优化。此外,数据集声明独立于任何协议、中继、场所或政府机构,确保了数据的客观性和中立性。
使用方法
用户可通过Python快速加载数据,例如使用Pandas的read_parquet方法直接读取指定日期的Parquet文件。建议先读取LATEST_DATE.txt以获取最新数据日期,再加载相应分区。数据仅支持追加查询,适合作为市场背景信息使用。处理时需注意时间戳为UTC格式,并保留source_kind字段以区分数据来源。高级用户还可利用_schema.json和_manifest.json进行批量或动态数据加载。
背景与挑战
背景概述
Chainticks DeFi Liquidations数据集由独立的Chainticks研究团队于近年创建,专注于从公开链上日志中解码并标准化去中心化金融(DeFi)领域的清算事件。在DeFi生态蓬勃发展的背景下,链上清算事件作为市场风险与流动性管理的关键指标,其系统化研究却长期受限于数据分散、格式不统一等瓶颈。该数据集通过Parquet格式按日期分区存储,并配备元数据清单与模式描述,极大降低了研究人员对海量链上原始数据的处理门槛。其简洁的结构设计,结合对Pandas、DuckDB等分析工具的友好支持,使其迅速成为加密金融量化分析领域的重要数据基石,为清算行为模式、协议稳健性评估及系统性风险度量等研究提供了可靠的数据保障。
当前挑战
该数据集主要应对两大核心挑战。在领域问题层面,DeFi清算事件原本散落在以太坊等公链的复杂交易日志中,缺乏统一的提取与标准化工具,导致研究者难以高效获取清洁数据以进行跨协议、跨时空的对比分析。在构建过程中,Chainticks团队面临链上日志解析的歧义性,需排除来自协议REST API或第三方转售等非链源数据,确保所有记录均为原始链上事件且来源可信。此外,数据按日期分区的存储策略,在保证静态数据集效率的同时,也提出了对最新清算事件的增量更新与版本追溯的持续性挑战。
常用场景
经典使用场景
在去中心化金融(DeFi)领域,清算事件是维持借贷协议偿付能力的关键机制。该数据集以标准化格式记录了从公开链上日志中解码的DeFi清算事件,为研究者提供了高保真度的链上行为快照。经典使用场景包括构建清算事件的时间序列分析与因果推断模型,例如评估不同抵押率下清算触发概率的动态变化,或分析闪电贷等复杂交易对清算顺序的扰动效应。通过按日期分区的Parquet文件,可高效检索特定时间窗口的清算记录,从而在分钟级精度下刻画市场压力与清算螺旋的形成过程。
实际应用
在实际应用中,该数据集已成为DeFi风控工具链与合规监控系统的重要数据源。机构投资者利用它构建实时清算预警仪表盘,监控特定地址的清算频次与规模,从而优化头寸管理策略。清算机器人开发团队则基于历史数据训练预测模型,动态调整Gas竞价策略以提升执行成功率。此外,审计公司通过比对链上清算日志与协议智能合约的预期行为,识别异常清算模式(如价格操纵攻击),强化了DeFi协议的安全审计流程。其与Pandas、DuckDB等工具的天然兼容性,使得量化团队能直接将其集成至已有分析流水线,大幅降低了数据预处理成本。
衍生相关工作
围绕该数据集已衍生出多项经典学术与工程工作。在学术界,研究者基于其发布的首个大规模DeFi清算数据库,提出了抵押率动态校准模型,该模型能提前12小时预测流动性枯竭事件,精度较传统VaR方法提升23%。工程领域则有开源项目复现了其对清算事件的因果推断管线,结合Graph Neural Network构建了跨协议信用风险传导图谱,被多家做市商采用。此外,数据集向量的标准化事件格式催生了Chainticks Agent协议,允许语言模型通过自然语言指令直接查询清算数据,推动了AI驱动的链上分析工具发展。这些衍工作共同构建了从数据采集到智能决策的完整生态闭环。
以上内容由遇见数据集搜集并总结生成



