Fraud-R1

github2025-02-19 更新2025-02-18 收录

下载链接：

https://github.com/kaustpradalab/Fraud-R1

下载链接

链接失效反馈

官方服务：

资源简介：

Fraud-R1是一个设计用来评估LLM在动态、现实世界场景中防御网络欺诈和钓鱼能力的基准。Fraud-R1包含了来自钓鱼诈骗、虚假职位发布、社交媒体和新闻的8564个欺诈案例，分为五大欺诈类型。与以前的基准不同，Fraud-R1引入了一个多轮评估管道，以评估LLM在不同阶段的欺诈抵抗力，包括信誉建设、紧迫感创造和情感操纵。

Fraud-R1 is a benchmark developed to evaluate the capability of large language models (LLMs) to defend against cyber fraud and phishing in dynamic, real-world scenarios. Fraud-R1 comprises 8,564 fraud cases collected from phishing scams, fraudulent job postings, social media platforms and news reports, which are classified into five major fraud categories. Unlike previous benchmarks, Fraud-R1 introduces a multi-turn evaluation pipeline to assess the fraud resistance of LLMs across different stages, including credibility building, urgency creation and emotional manipulation.

创建时间：

2025-02-04

原始信息汇总

Fraud-R1 数据集概述

数据集简介

Fraud-R1 是一个用于评估大型语言模型（LLM）在动态、真实世界场景下对抗网络欺诈和钓鱼攻击能力的数据集。

数据集构成

数据来源：包含 8,564 个来自网络钓鱼诈骗、虚假招聘广告、社交媒体和新闻的欺诈案例。
数据类型：分为基础数据集（Base Dataset）和升级数据集（Level-up Dataset）。
数据划分：基础数据集占 25%，升级数据集占 75%。
语言分布：中文占 50%，英文占 50%。
欺诈类型：
- 欺诈服务：28.04%
- 冒充：28.04%
- 网络钓鱼诈骗：22.06%
- 虚假招聘广告：14.02%
- 网络关系：7.84%
平均令牌长度：273.92 tokens

评估流程

评估 LLMs 在两种不同设置（Helpful Assistant 和 Role-play）下的欺诈诱导识别和防御能力。
通过多轮对话设置来评估模型在不同阶段的抵抗力，包括建立信任、创建紧迫感和利用情感诉求。

数据增强

使用 Deepseek-R1 生成欺诈信息，并通过多阶段精炼过程构建升级数据集。

模型性能

公开了在 Fraud-R1 数据集上的模型性能排行榜，包括防御成功率（DSR%）和防御失败率（DFR%）。

注意事项

该数据集包含可能令人不适的攻击性内容，仅供教育和研究使用。

联系方式

Shu Yang: shu.yang@kaust.edu.sa
Shenzhe Zhu: cho.zhu@mail.utoronto.ca

引用信息

BibTeX 信息待填写。

搜集汇总

数据集介绍

构建方式

Fraud-R1数据集的构建起始于对现实世界中网络诈骗案例的多渠道搜集，进而从中提炼出关键的诈骗策略与意图。利用`Deepseek-R1`模型生成诈骗信息、邮件和帖子，经过筛选后形成基础数据集（Base Dataset）。通过多阶段的精炼流程，构建出能够对LLM模型进行鲁棒评估的进阶数据集（Level-up Dataset），以模拟日益复杂的诈骗场景。

使用方法

使用Fraud-R1数据集，首先需要创建运行环境并配置API。之后，可以通过执行脚本进行多轮诱导攻击和评估，以检验LLM模型在帮助助手和角色扮演两种设置下的鲁棒性。评估结果存储在results目录中供后续检查。整个评估流程涉及对模型防御成功率和失败率的计算，并提供了排行榜以比较不同模型的性能表现。

背景与挑战

背景概述

Fraud-R1数据集是一项针对评估大型语言模型（LLM）在动态、现实世界场景下对抗网络欺诈和钓鱼诱导能力的研究成果。该数据集由杨舒等研究人员于2025年创建，汇集了8564个来自网络钓鱼诈骗、虚假招聘广告、社交媒体和新闻的欺诈案例，涵盖了五大欺诈类型。Fraud-R1的推出，旨在推动对LLM在防御网络欺诈方面的研究，对网络安全和人工智能领域具有重要的实践与参考价值。

当前挑战

该数据集在构建过程中所面临的挑战主要包括：1）欺诈策略和意图的提取与分类，需要准确识别并理解复杂的欺诈手段；2）数据增强和多层次对话设置的模拟，以构建能够适应不同阶段欺诈诱导的评估环境。此外，研究还揭示了当前LLM在防御欺诈和钓鱼诱导方面存在的重大挑战，特别是在角色扮演设置和虚假招聘广告中，以及中英双语检测能力的显著性能差距。

常用场景

经典使用场景

在当前网络环境下，防范网络欺诈和钓鱼攻击显得尤为重要。Fraud-R1数据集作为评估大型语言模型（LLM）对于动态现实场景中网络欺诈和钓鱼攻击防御能力的基准，其经典使用场景主要在于通过多轮对话的方式，模拟网络欺诈的不同阶段，如建立信任、制造紧迫感和情感操纵，以评估LLM的鲁棒性和防御效果。

解决学术问题

Fraud-R1数据集解决了学术界在评估LLM对于网络欺诈防御能力方面的关键问题。它通过多轮评估流程，揭示了LLM在帮助助手和角色扮演两种设置下对欺诈诱导的识别和防御的挑战，并指出了中文和英文之间在欺诈检测能力上的显著差距，为多语言欺诈检测的研究提供了重要参考。

实际应用

在实际应用中，Fraud-R1数据集可用于训练和评估网络安全系统，提高对网络欺诈和钓鱼攻击的识别能力。它还可以作为安全教育和意识提升的工具，帮助用户识别和防范网络风险，从而保护个人和企业的信息安全。

数据集最近研究