3MEthTaskforce
收藏arXiv2025-01-21 更新2025-01-23 收录
下载链接:
https://figshare.com/s/42e1bec80cd0b1809d14
下载链接
链接失效反馈官方服务:
资源简介:
3MEthTaskforce数据集是一个多源、多层次、多代币的以太坊数据集,由奥克兰大学和北京理工大学的研究团队开发。该数据集整合了3.03亿笔交易记录、3880个代币的元数据、全球市场指标以及Reddit社区的情感数据,涵盖了从2014年至2024年的数据。数据集的内容包括交易记录、代币信息、全球市场指标和社交媒体文本,旨在支持用户行为预测和代币价格预测等任务。数据集的创建过程通过多源数据整合,使用了Ethereum Public ETL工具、DefiLlama和Reddit API等开源工具进行数据收集。该数据集的应用领域主要集中在区块链分析和去中心化金融研究,旨在解决加密货币市场中的用户行为分析、市场波动建模和风险分析等问题。
The 3MEthTaskforce Dataset is a multi-source, multi-level, multi-token Ethereum dataset developed by research teams from the University of Auckland and Beijing Institute of Technology. This dataset integrates 303 million transaction records, metadata of 3,880 tokens, global market indicators, and sentiment data from the Reddit community, covering the period from 2014 to 2024. Its content includes transaction records, token information, global market indicators, and social media text, and is designed to support tasks such as user behavior prediction and token price prediction. The dataset was constructed via multi-source data integration, with open-source tools including Ethereum Public ETL, DefiLlama, and Reddit API utilized for data collection. Its main application areas focus on blockchain analysis and decentralized finance (DeFi) research, aiming to address issues including user behavior analysis, market volatility modeling, and risk analysis in the cryptocurrency market.
提供机构:
奥克兰大学计算机科学学院, 北京理工大学计算机科学与技术学院
创建时间:
2025-01-21
搜集汇总
数据集介绍

构建方式
3MEthTaskforce数据集的构建采用了多源数据整合策略,涵盖了以太坊区块链上的交易记录、代币信息、全球市场指标以及Reddit社区的情感数据。通过使用Ethereum Public ETL工具、DefiLlama平台和Reddit API(PRAW),研究人员从2014年至2024年间的公开数据中提取了3.03亿笔交易记录、3880种代币的元数据、全球市场指数以及7800条Reddit帖子。这些数据经过清洗和标注,确保了数据的完整性和一致性,最终形成了一个多源、多层次、多代币的综合数据集。
特点
3MEthTaskforce数据集的核心特点在于其多模态设计,涵盖了交易、代币信息、市场指标和情感数据等多个维度。数据集包含3.03亿笔交易记录,涉及3500万个钱包地址和3880种代币,同时还整合了全球市场指标和Reddit社区的情感分析数据。这种多源数据的融合使得该数据集能够支持用户行为预测、代币价格预测等复杂任务,并为区块链分析和去中心化金融研究提供了全面的数据基础。此外,数据集还定义了基准任务,并通过6种动态图神经网络和19种时间序列模型进行了性能评估。
使用方法
3MEthTaskforce数据集的使用方法主要围绕用户行为预测和代币价格预测两大任务展开。用户行为预测任务通过构建时间动态图,利用图神经网络模型预测用户未来的交易行为;代币价格预测任务则通过整合历史价格、全球市场指标和情感数据,使用时间序列模型进行价格波动预测。数据集提供了详细的实验设置和基准模型,用户可以根据任务需求选择不同的输入特征和模型架构。此外,数据集还支持风险分析和市场波动建模,为区块链研究和去中心化金融应用提供了丰富的实验平台。
背景与挑战
背景概述
3MEthTaskforce数据集由奥克兰大学计算机科学学院的Liu AI Lab团队于2025年创建,旨在解决加密货币市场分析中单一数据源的局限性。该数据集整合了2014年至2024年间超过3亿笔交易记录、3880种代币信息、全球市场指标以及Reddit情感数据,涵盖了用户行为、市场情绪和代币表现的全面研究。通过引入多源、多层次、多代币的数据结构,3MEthTaskforce为区块链分析和去中心化金融研究提供了重要资源,特别是在用户行为预测和代币价格预测任务中,定义了基准并评估了多种动态图神经网络和时间序列模型的性能。
当前挑战
3MEthTaskforce数据集在构建和应用中面临多重挑战。首先,加密货币市场的高波动性和复杂性使得用户行为预测和代币价格预测任务极具挑战性,尤其是在市场情绪和全球指标的多重影响下。其次,数据集的构建过程中,整合多源数据(如交易记录、市场指标和社交媒体情感数据)需要克服数据格式不一致、时间对齐和数据清洗等技术难题。此外,尽管数据集提供了丰富的信息,但其覆盖范围和数据质量仍可能受到限制,例如Reddit情感数据可能存在偏差,且部分代币的交易记录可能不完整。这些挑战要求研究者在模型设计和数据分析中采取更为精细的策略,以确保结果的准确性和可靠性。
常用场景
经典使用场景
3MEthTaskforce数据集在加密货币研究领域的经典使用场景主要集中在用户行为预测和代币价格预测两大任务上。通过整合多源数据,包括交易记录、代币信息、市场指数和社交媒体情感数据,该数据集为研究人员提供了一个全面的平台,用于分析用户行为模式、市场波动以及代币表现。其多模态设计使得模型能够捕捉到交易活动、市场情绪和全球市场趋势之间的复杂交互关系,从而为区块链分析和去中心化金融研究提供了强有力的支持。
解决学术问题
3MEthTaskforce数据集解决了现有单源数据集在加密货币研究中的局限性问题。传统数据集往往只关注交易的单一维度,缺乏对市场情绪和全球市场趋势的综合考量。该数据集通过整合多源数据,填补了这一空白,使得研究人员能够更全面地建模用户行为与市场动态之间的关系。此外,数据集还定义了用户行为预测和代币价格预测的基准任务,并通过6种动态图神经网络和19种时间序列模型进行性能评估,推动了加密货币分析领域的研究进展。
衍生相关工作
3MEthTaskforce数据集的发布推动了多个相关领域的研究工作。例如,基于该数据集的研究衍生出了多种动态图神经网络模型,如DyGFormer和JODIE,这些模型在用户行为预测任务中表现出色。此外,数据集还为时间序列预测模型提供了新的基准,如FITS和iTransformer,这些模型在代币价格预测任务中展现了优异的性能。通过这些衍生工作,3MEthTaskforce不仅丰富了加密货币分析的研究工具,还为区块链技术的进一步发展提供了新的思路。
以上内容由遇见数据集搜集并总结生成



