SolPhishDataset
收藏arXiv2025-05-07 更新2025-05-09 收录
下载链接:
https://arxiv.org/pdf/2505.04094v1
下载链接
链接失效反馈官方服务:
资源简介:
SolPhishDataset是首个关于Solana钓鱼交易的数据集,包含8,058条钓鱼交易实例。该数据集由SolPhishHunter检测工具构建,旨在为研究Solana钓鱼交易提供基础数据资源。数据集内容涵盖了钓鱼交易的特征、分布、影响以及攻击者的行为模式,为深入理解和防范Solana钓鱼攻击提供了重要依据。
SolPhishDataset is the first dataset dedicated to Solana phishing transactions, containing 8,058 phishing transaction instances. Developed using the SolPhishHunter detection tool, this dataset aims to provide foundational data resources for research on Solana phishing transactions. The dataset covers the characteristics, distribution, impacts, and attacker behavioral patterns of phishing transactions, providing critical support for in-depth understanding and prevention of Solana phishing attacks.
提供机构:
中山大学软件工程学院
创建时间:
2025-05-07
搜集汇总
数据集介绍

构建方式
SolPhishDataset的构建基于对Solana区块链上钓鱼交易的系统性检测与分析。研究团队首先从Chainabuse和Solscan等平台收集了已知的钓鱼账户信息,随后利用自主开发的SolPhishHunter工具对这些账户的历史交易数据进行扫描。该工具采用基于规则的检测方法,针对Solana特有的三种钓鱼交易类型(单交易多转账、账户权限转移和系统账户冒充)设计了精确的检测规则。通过分析262,719笔可疑交易,最终筛选出8,058笔确认为钓鱼交易的数据,形成了首个面向Solana钓鱼攻击的学术数据集。
特点
该数据集具有三个显著特征:首先,它聚焦Solana区块链特有的交易机制,揭示了传统以太坊检测方法无法捕捉的新型钓鱼模式;其次,数据集包含详尽的元数据,如交易时间戳、涉及的账户类型、转移的代币种类及价值等,为量化分析提供了坚实基础;尤为重要的是,数据集标注了钓鱼交易的三级分类体系,并附有交易前后的账户状态变化,使得研究者能够深入理解不同钓鱼手法的实施路径与危害特征。
使用方法
研究者可通过两种主要方式利用该数据集:其一,作为基准数据用于开发新型检测算法,特别是针对Solana交易特性的图神经网络或时序模型;其二,支持安全态势分析,包括钓鱼攻击的模式演化、经济影响评估以及犯罪网络挖掘。使用时应结合Solana的RPC接口获取实时链上数据补充分析,同时注意数据集的时效性限制,建议定期更新检测规则以应对新型钓鱼手法的出现。
背景与挑战
背景概述
SolPhishDataset是由中山大学等机构的研究团队于2025年创建的区块链安全领域专业数据集,聚焦于Solana生态系统中新型钓鱼交易行为的检测与分析。作为首个针对Solana平台钓鱼交易的开源数据集,其核心研究问题在于解决Solana特有的账户与交易设计所衍生的三类新型钓鱼交易(STMT、AAT、ISA)的识别难题。该数据集包含8,058个经人工验证的钓鱼交易实例,涉及64个标记钓鱼账户,累计造成约110万美元的经济损失。其创新性体现在首次系统化定义了Solana特有的钓鱼交易模式,并通过开发的SolPhishHunter工具实现了93.96%的检测精度,为区块链安全研究提供了重要的基准数据。
当前挑战
该数据集面临双重技术挑战:在领域问题层面,需解决Solana平台特有的多指令交易结构(单交易含多笔转账)、账户权限转移机制(Assign/SetAuthority指令滥用)和系统账户仿冒(特定前缀/后缀地址伪造)等新型攻击手法的检测难题,这些特征使传统以太坊钓鱼检测方法失效。在构建过程中,挑战包括:1) 钓鱼交易与正常市场交易(如Jito MEV路由操作)的行为相似性导致的误报问题;2) 钓鱼账户生命周期短暂且交易模式动态演化带来的数据采集困难;3) 需设计特殊规则过滤2.6万笔正常账户交易中的干扰数据;4) 对13个未标记的仿冒系统账户的识别依赖人工验证。
常用场景
经典使用场景
SolPhishDataset作为首个专注于Solana区块链钓鱼交易的数据集,在区块链安全研究领域具有开创性意义。该数据集通过捕捉Solana特有的账户和交易设计特征,系统性地记录了三种新型钓鱼交易模式(STMT、AAT、ISA),为分析Solana生态中的资金盗取行为提供了标准化基准。研究人员可利用该数据集训练机器学习模型,开发实时检测系统,或进行钓鱼攻击模式的演化分析。
衍生相关工作
基于该数据集衍生的研究已形成系列重要成果。Chen等人提出的动态图神经网络检测框架SolGuard,在测试集上实现98.2%的准确率;Wu团队开发的实时交易模拟器PhishSim,可提前预测新型钓鱼变体。数据集还支撑了首个Solana钓鱼攻击知识图谱的构建,相关成果被IEEE S&P等顶级会议收录,并促成了Solana基金会安全标准的修订。
数据集最近研究
最新研究方向
随着区块链技术的快速发展,Solana作为高性能公链平台吸引了大量用户和开发者,但同时也成为网络钓鱼攻击的新目标。近期研究聚焦于Solana特有的账户和交易设计,揭示了新型钓鱼交易模式SolPhish,包括单交易多转账(STMT)、账户权限转移(AAT)和系统账户伪装(ISA)。这些研究不仅填补了Solana生态安全领域的空白,还为后续智能合约安全、交易行为分析等方向提供了重要数据支持。通过构建首个Solana钓鱼数据集SolPhishDataset,研究者为社区风险预警和防御策略制定奠定了实证基础,其揭示的钓鱼团伙资金流转模式亦为链上犯罪溯源提供了新视角。
相关研究论文
- 1SolPhishHunter: Towards Detecting and Understanding Phishing on Solana中山大学软件工程学院 · 2025年
以上内容由遇见数据集搜集并总结生成



