Fraud-R1
收藏github2025-02-19 更新2025-02-18 收录
下载链接:
https://github.com/kaustpradalab/Fraud-R1
下载链接
链接失效反馈官方服务:
资源简介:
Fraud-R1是一个设计用来评估LLM在动态、现实世界场景中防御网络欺诈和钓鱼能力的基准。Fraud-R1包含了来自钓鱼诈骗、虚假职位发布、社交媒体和新闻的8564个欺诈案例,分为五大欺诈类型。与以前的基准不同,Fraud-R1引入了一个多轮评估管道,以评估LLM在不同阶段的欺诈抵抗力,包括信誉建设、紧迫感创造和情感操纵。
Fraud-R1 is a benchmark developed to evaluate the capability of large language models (LLMs) to defend against cyber fraud and phishing in dynamic, real-world scenarios. Fraud-R1 comprises 8,564 fraud cases collected from phishing scams, fraudulent job postings, social media platforms and news reports, which are classified into five major fraud categories. Unlike previous benchmarks, Fraud-R1 introduces a multi-turn evaluation pipeline to assess the fraud resistance of LLMs across different stages, including credibility building, urgency creation and emotional manipulation.
创建时间:
2025-02-04
原始信息汇总
Fraud-R1 数据集概述
数据集简介
Fraud-R1 是一个用于评估大型语言模型(LLM)在动态、真实世界场景下对抗网络欺诈和钓鱼攻击能力的数据集。
数据集构成
- 数据来源:包含 8,564 个来自网络钓鱼诈骗、虚假招聘广告、社交媒体和新闻的欺诈案例。
- 数据类型:分为基础数据集(Base Dataset)和升级数据集(Level-up Dataset)。
- 数据划分:基础数据集占 25%,升级数据集占 75%。
- 语言分布:中文占 50%,英文占 50%。
- 欺诈类型:
- 欺诈服务:28.04%
- 冒充:28.04%
- 网络钓鱼诈骗:22.06%
- 虚假招聘广告:14.02%
- 网络关系:7.84%
- 平均令牌长度:273.92 tokens
评估流程
- 评估 LLMs 在两种不同设置(Helpful Assistant 和 Role-play)下的欺诈诱导识别和防御能力。
- 通过多轮对话设置来评估模型在不同阶段的抵抗力,包括建立信任、创建紧迫感和利用情感诉求。
数据增强
- 使用
Deepseek-R1生成欺诈信息,并通过多阶段精炼过程构建升级数据集。
模型性能
- 公开了在 Fraud-R1 数据集上的模型性能排行榜,包括防御成功率(DSR%)和防御失败率(DFR%)。
注意事项
- 该数据集包含可能令人不适的攻击性内容,仅供教育和研究使用。
联系方式
- Shu Yang: shu.yang@kaust.edu.sa
- Shenzhe Zhu: cho.zhu@mail.utoronto.ca
引用信息
- BibTeX 信息待填写。
搜集汇总
数据集介绍

构建方式
Fraud-R1数据集的构建起始于对现实世界中网络诈骗案例的多渠道搜集,进而从中提炼出关键的诈骗策略与意图。利用`Deepseek-R1`模型生成诈骗信息、邮件和帖子,经过筛选后形成基础数据集(Base Dataset)。通过多阶段的精炼流程,构建出能够对LLM模型进行鲁棒评估的进阶数据集(Level-up Dataset),以模拟日益复杂的诈骗场景。
使用方法
使用Fraud-R1数据集,首先需要创建运行环境并配置API。之后,可以通过执行脚本进行多轮诱导攻击和评估,以检验LLM模型在帮助助手和角色扮演两种设置下的鲁棒性。评估结果存储在results目录中供后续检查。整个评估流程涉及对模型防御成功率和失败率的计算,并提供了排行榜以比较不同模型的性能表现。
背景与挑战
背景概述
Fraud-R1数据集是一项针对评估大型语言模型(LLM)在动态、现实世界场景下对抗网络欺诈和钓鱼诱导能力的研究成果。该数据集由杨舒等研究人员于2025年创建,汇集了8564个来自网络钓鱼诈骗、虚假招聘广告、社交媒体和新闻的欺诈案例,涵盖了五大欺诈类型。Fraud-R1的推出,旨在推动对LLM在防御网络欺诈方面的研究,对网络安全和人工智能领域具有重要的实践与参考价值。
当前挑战
该数据集在构建过程中所面临的挑战主要包括:1)欺诈策略和意图的提取与分类,需要准确识别并理解复杂的欺诈手段;2)数据增强和多层次对话设置的模拟,以构建能够适应不同阶段欺诈诱导的评估环境。此外,研究还揭示了当前LLM在防御欺诈和钓鱼诱导方面存在的重大挑战,特别是在角色扮演设置和虚假招聘广告中,以及中英双语检测能力的显著性能差距。
常用场景
经典使用场景
在当前网络环境下,防范网络欺诈和钓鱼攻击显得尤为重要。Fraud-R1数据集作为评估大型语言模型(LLM)对于动态现实场景中网络欺诈和钓鱼攻击防御能力的基准,其经典使用场景主要在于通过多轮对话的方式,模拟网络欺诈的不同阶段,如建立信任、制造紧迫感和情感操纵,以评估LLM的鲁棒性和防御效果。
解决学术问题
Fraud-R1数据集解决了学术界在评估LLM对于网络欺诈防御能力方面的关键问题。它通过多轮评估流程,揭示了LLM在帮助助手和角色扮演两种设置下对欺诈诱导的识别和防御的挑战,并指出了中文和英文之间在欺诈检测能力上的显著差距,为多语言欺诈检测的研究提供了重要参考。
实际应用
在实际应用中,Fraud-R1数据集可用于训练和评估网络安全系统,提高对网络欺诈和钓鱼攻击的识别能力。它还可以作为安全教育和意识提升的工具,帮助用户识别和防范网络风险,从而保护个人和企业的信息安全。
数据集最近研究
最新研究方向
Fraud-R1数据集是一项针对大型语言模型在对抗网络欺诈和钓鱼诱导方面的鲁棒性评估的基准。该数据集整合了来自网络诈骗、虚假招聘信息、社交媒体和新闻等渠道的8564个欺诈案例,并分为五种主要的欺诈类型。Fraud-R1的创新之处在于引入了多轮评估流程,以模拟现实世界中动态的欺诈场景,评估LLM在不同阶段(如建立信任、制造紧迫感和情感操纵)的防御能力。近期研究聚焦于在帮助型助手和角色扮演两种设置下,LLM模型的防御成功率和失败率,揭示了在对抗欺诈和钓鱼诱导方面的重大挑战,特别是在角色扮演设置和虚假招聘信息中。此外,研究中还观察到中文和英文模型在性能上存在显著差距,指出了提升多语言欺诈检测能力的必要性。
以上内容由遇见数据集搜集并总结生成



