ZKsync Era Data
收藏arXiv2024-07-26 更新2024-07-30 收录
下载链接:
https://github.com/matter-labs/zksync-era-data
下载链接
链接失效反馈官方服务:
资源简介:
ZKsync Era数据集是由Matter Labs和帝国理工学院联合创建的公开区块链数据集,涵盖了从2023年2月14日至2024年3月24日的一年期间内的区块链活动。该数据集包含327,174,035条交易记录,涉及区块、交易、收据和日志等多种数据类型,旨在为研究人员提供丰富的数据资源。数据集的创建过程包括从ZKsync Era归档节点提取原始数据,并进行预处理以适应分析需求。该数据集主要应用于区块链技术的研究领域,特别是在ZKsync和Layer-2区块链的扩展解决方案中,有助于推动相关技术的深入研究和应用。
提供机构:
帝国理工学院
创建时间:
2024-07-26
搜集汇总
数据集介绍

构建方式
ZKsync Era Data数据集的构建方式主要涉及从ZKsync Era存档节点中提取一年内的活动数据。该数据集包含块、交易、收据和日志等信息。为了便于用户使用,数据集进行了预处理,将其格式化为Parquet格式,这种格式可以通过Python中的Pandas和Polars等知名库轻松访问。数据集的构建不仅为研究人员提供了直接的数据访问方式,还通过GitHub公开了用于分析的代码,以促进可重复性和进一步的研究。
特点
ZKsync Era Data数据集的主要特点包括:1) 数据集涵盖了从2023年2月14日到2024年3月24日的一年时间,包含了3.27亿笔交易和1.63万个合约部署;2) 数据集包含了块、交易、收据和日志等信息,为研究人员提供了全面的数据分析基础;3) 数据集以Parquet格式存储,便于处理和内存管理;4) 数据集公开了分析代码,便于用户快速上手和进行进一步的研究。
使用方法
ZKsync Era Data数据集的使用方法主要包括:1) 通过GitHub仓库下载数据集;2) 使用Python中的Pandas或Polars等库读取数据;3) 使用GitHub上提供的Jupyter Notebook代码进行数据分析和可视化;4) 根据自己的研究需求,对数据进行进一步的处理和分析。数据集提供了丰富的交易、合约和日志信息,可以用于研究交易费用、Gas使用情况、合约部署、代币交换等多个方面。
背景与挑战
背景概述
区块链技术的核心在于去中心化和透明度,然而,区块链数据对于终端用户和非技术研究人员来说并不容易获取,这一挑战限制了区块链技术的广泛应用。为了解决这一问题,研究人员从ZKsync Era存档节点中提取了1年的活动数据,并将其免费提供给外部用户。这一数据集对于研究区块链技术具有重要意义,例如预警、空投设计、分析最大可提取价值(MEV)、自动做市商(AMM)以及提升特定区块链的采用率等。通过提供这一数据集,研究人员希望促进区块链领域的研究,并推动区块链生态系统的发展。
当前挑战
尽管区块链数据理论上公开可用,但实际获取数据却面临着诸多挑战。首先,区块链数据不易获取,限制了区块链技术的广泛应用。其次,通过远程过程调用(RPCs)提供商获取数据对于一些非技术人员和研究人员来说可能具有挑战性,并且通常成本较高。最后,尽管可以依赖外部数据源,如Etherscan、Arbiscan、Dune等,但长期来看,这些数据源可能成本高昂,并且可能无法满足某些终端用户的需求,尤其是那些依赖于易于获取且成本较低的数据的研究人员。因此,研究人员希望提供一种替代方案,以改善这一状况,使区块链数据更易于获取,无需担心基础设施或硬件。
常用场景
经典使用场景
ZKsync Era Data 数据集为研究人员提供了一个宝贵的机会,以探索和分析 ZKsync Era 区块链生态系统中的交易、智能合约部署和用户活动。通过对过去一年中 ZKsync Era 网络上发生的所有活动进行深入分析,研究人员可以更好地理解 Layer 2 (L2) 生态系统的运行方式,并识别潜在的研究方向和改进空间。该数据集还允许研究人员研究 ZKsync Era 的性能,包括交易费用、Gas 使用量以及用户行为。此外,该数据集还可以用于分析 MEV 和套利机会,以及用户在区块链上的活动。最后,该数据集对于数据科学家和区块链爱好者来说也是一个宝贵的资源,他们可以利用该数据集来探索和了解区块链数据。
衍生相关工作
ZKsync Era Data 数据集衍生了许多相关的研究工作。例如,研究人员可以利用该数据集来研究 MEV 和套利机会,以及用户在区块链上的活动。此外,该数据集还可以用于分析区块链的性能,包括交易费用、Gas 使用量以及用户行为。最后,该数据集对于数据科学家和区块链爱好者来说也是一个宝贵的资源,他们可以利用该数据集来探索和了解区块链数据。
数据集最近研究
最新研究方向
在区块链领域,特别是对于第二层(L2)生态系统,ZKsync 作为一种基于零知识证明(ZKP)的扩展解决方案,已经成为研究的热点。ZKsync Era Data 数据集的发布为研究人员提供了宝贵的资源,使其能够更深入地研究 L2 链,并推动 ZKsync 相关研究的发展。该数据集涵盖了从 2023 年 2 月 14 日到 2024 年 3 月 24 日的 ZKsync Era 网络活动,包括区块、交易、收据和日志等信息。研究人员可以利用这些数据来分析交易费用、燃料消耗、事件日志、代币交换等活动,以及评估用户行为、智能合约部署等指标。此外,该数据集还支持对最大可提取价值(MEV)和套利策略的研究,以及对 L2 链上用户活动的影响进行深入分析。这些研究对于推动 ZKsync 和其他 L2 链的采用和生态系统发展具有重要意义。
相关研究论文
- 1A Public Dataset For the ZKsync Rollup帝国理工学院 · 2024年
以上内容由遇见数据集搜集并总结生成



