Financial Fraud Alert Review Dataset (FiFAR)
收藏arXiv2023-12-21 更新2024-06-21 收录
下载链接:
https://github.com/feedzai/fifar-dataset
下载链接
链接失效反馈官方服务:
资源简介:
FiFAR数据集是由里斯本大学理工学院创建的一个合成银行账户欺诈检测数据集,旨在模拟复杂的欺诈分析师行为。该数据集包含50个具有不同偏差和特征依赖性的合成欺诈分析师的预测,以及对人类工作容量限制的现实定义,以便在真实世界条件下测试分配系统。数据集通过模拟真实数据可用性条件,为学习推迟(L2D)研究提供了一个平台,特别是在金融欺诈检测领域,旨在通过人机协作优化决策过程。
The FiFAR Dataset is a synthetic bank account fraud detection dataset developed by the Instituto Superior Técnico, University of Lisbon. It is intended to simulate the operational behaviors of seasoned fraud analysts. The dataset encompasses predictions generated by 50 synthetic fraud analysts with distinct biases and feature dependencies, paired with realistic constraints on human workload capacity, to enable the evaluation of task assignment systems under real-world conditions. By replicating real-world data availability scenarios, the dataset serves as a dedicated platform for Learning to Defer (L2D) research, specifically within the financial fraud detection domain, with the overarching goal of optimizing decision-making workflows via human-machine collaboration.
提供机构:
里斯本大学理工学院
创建时间:
2023-12-21
搜集汇总
数据集介绍

构建方式
在金融欺诈检测领域,现有公开数据集难以支持学习延迟算法的开发与评估。为此,FiFAR数据集基于公开的银行账户欺诈检测数据集构建,通过创新的实例依赖噪声方法生成了50位高度复杂的合成欺诈分析师预测。这些合成专家模拟了多样化的人类行为,包括不同的特征依赖性、模型依赖性和偏见倾向。同时,数据集引入了现实的人类工作容量约束,将实例划分为多个批次,并为每个批次定义每位专家可处理的实例上限,从而模拟真实世界中人机协作系统的运行条件。
特点
FiFAR数据集的核心特点在于其高度仿真的合成专家团队与容量约束机制。合成专家通过参数化模型生成,具备特征依赖性和模型依赖性,能够模拟人类决策中的不一致性、偏见及性能差异。专家分为标准、不公平、模型认同和稀疏四类,覆盖了从公平性到算法偏向的多种行为模式。此外,数据集提供了300种不同的测试场景,涵盖不同的批次大小、延迟率、专家缺席率等参数组合,为评估人机协作系统在多变环境下的性能与公平性提供了丰富基准。
使用方法
使用FiFAR数据集时,研究者可基于其时间划分模拟现实部署场景:首先利用前三个月数据训练欺诈检测模型,随后在第四至第八个月的数据上集成合成专家预测。训练阶段使用第四至第六个月的数据,验证使用第七个月数据,测试则在第八个月进行。数据集支持开发容量感知的学习延迟算法,例如拒绝学习及其变体,通过优化实例分配以平衡模型与专家决策。评估时采用成本敏感损失函数和预测公平性指标,确保系统在控制误报率的同时提升召回率,并减少对敏感属性的偏见。
背景与挑战
背景概述
在人工智能与人类协作(HAIC)的研究领域,公开数据集的匮乏长期制约着学习延迟(L2D)算法的发展与评估。金融欺诈检测作为高风险应用场景,亟需能够模拟真实人机协同决策的基准数据。为此,Feedzai公司与里斯本大学的研究团队于2023年联合发布了金融欺诈警报审查数据集(FiFAR)。该数据集基于合成银行账户欺诈检测数据,构建了包含50位具有复杂行为特征的虚拟分析师团队,其核心在于解决人机混合系统中如何优化任务分配的关键问题。通过引入现实工作容量约束与多样化专家行为建模,FiFAR为L2D方法提供了系统化评估框架,显著推动了协同决策系统的可复现性与透明度研究。
当前挑战
FiFAR数据集致力于应对金融欺诈检测领域中人机协同决策的核心挑战:如何在有限的人类专家工作容量下,动态分配任务以最大化系统整体效能。具体而言,该领域需解决专家行为的高度异质性、模型与人类决策的互补性平衡,以及敏感属性引发的公平性风险等复杂问题。在数据集构建过程中,研究团队面临合成专家行为真实性与多样性的建模难题,需通过实例依赖噪声技术模拟特征相关性、算法偏见及决策不一致性等人因特性。同时,容量约束的批量动态定义、训练数据中专家预测的稀疏性,以及跨场景泛化能力的验证,均为构建过程带来显著挑战。
常用场景
经典使用场景
在金融欺诈检测领域,FiFAR数据集为学习延迟(L2D)算法的开发与评估提供了关键支持。该数据集通过模拟50位具有复杂行为特征的合成欺诈分析师预测,构建了一个高度逼真的人机协作决策环境。研究人员可利用此数据集训练和测试分配系统,优化人工智能模型与人类专家之间的任务分配策略,从而在银行账户开户欺诈检测等高风险场景中实现协同决策效能的提升。
实际应用
在实际金融风控系统中,FiFAR数据集可用于模拟欺诈警报审核流程,其中机器学习模型初步筛选交易,人类专家对高风险案例进行复核。数据集涵盖的容量限制与专家缺席等现实因素,使得机构能够测试并优化人机协作框架的鲁棒性,从而在降低误报率、提升检测召回率的同时,确保决策过程符合公平性要求,为银行、支付平台等提供可部署的混合智能解决方案参考。
衍生相关工作
基于FiFAR数据集,研究者已开发出容量感知的L2D基线方法,如贪婪分配与整数线性规划优化策略,并在300余种测试场景下进行了系统评估。这些工作扩展了传统拒绝学习框架,促进了多专家环境下延迟学习算法的发展。后续研究可进一步探索合成专家行为建模的泛化能力,以及在不同保护属性下公平性约束的集成,为人机协同决策系统的实际应用奠定方法论基础。
以上内容由遇见数据集搜集并总结生成



