Paysim1|金融欺诈检测数据集|行为分析数据集
收藏Bank Fraud Detection Project
数据集概述
数据集来源
- 数据集链接: https://www.kaggle.com/datasets/ealaxi/paysim1
项目概述
- 该项目专注于检测银行数据集中的欺诈交易。分析利用交易的各种属性来识别欺诈的指示性模式。数据集模拟了30天内的交易,提供了合法和欺诈活动的行为洞察。
数据集描述
- 数据集包含以下列:
- step:
- 表示交易的时间单位,每一步相当于1小时。总步数为744,模拟30天。
- type:
- 交易类型:
- CASH-IN: 存款到账户。
- CASH-OUT: 从账户取款。
- DEBIT: 直接从账户取款。
- PAYMENT: 向商家或服务支付。
- TRANSFER: 账户之间的资金转移。
- 交易类型:
- amount:
- 交易涉及的金额,以当地货币计。
- nameOrig:
- 发起交易的客户ID。
- oldbalanceOrg:
- 交易前发起账户的余额。
- newbalanceOrig:
- 交易后发起账户的余额。
- nameDest:
- 接收账户的ID。
- oldbalanceDest:
- 交易前接收账户的余额。
- newbalanceDest:
- 交易后接收账户的余额。
- isFraud:
- 欺诈检测的目标列。值为
1
表示欺诈交易,0
表示合法交易。
- 欺诈检测的目标列。值为
- isFlaggedFraud:
- 指示交易是否被标记为可疑。被标记的交易涉及超过
200,000
的转账。
- 指示交易是否被标记为可疑。被标记的交易涉及超过
- step:
分析报告概述
- 该报告概述了分析交易数据以检测欺诈活动的步骤。分析重点在于不同交易类型、金额和潜在的欺诈指示器。
探索的问题
- 总交易数量及其中欺诈交易的数量。
- 每种交易类型的交易数量及其中被标记为欺诈的数量。
TRANSFER
和CASH_OUT
类型的平均和最大交易金额,以及每种类型的欺诈交易数量。- 涉及欺诈交易的账户余额是否存在差异。
CASH_OUT
和TRANSFER
类型的欺诈交易详情,以及涉及的唯一账户数量。- 如何将交易分类到不同范围并分析不同交易规模的欺诈率。
- 交易类型与其金额之间的关系,以及每种类型和类别的欺诈交易百分比。
- 如果在分析过程中不知道特定步骤(例如步骤212),如何识别每种交易类型的交易数量。
- 每种交易类型在步骤212的交易数量。
- 每个分类范围的交易金额及其中欺诈交易的数量。
- 交易金额与欺诈交易数量之间的关系。
- 不同交易类型的平均、最大和最小交易金额及每种类型的欺诈交易数量。
- 每种交易类型在不同分类金额范围内的欺诈交易百分比。
- 基于交易类型和金额类别的欺诈交易细分。
结论
- 分析提供了交易数据中可能指示欺诈行为的模式和异常的洞察。通过结构化的提问方法,系统地揭示了这些洞察,有助于更好地理解交易欺诈的动态。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
PROSLU
PROSLU数据集是由哈尔滨工业大学社会计算与信息检索研究中心和华为技术有限公司共同创建的,包含超过5000条中文语句,每条语句都配有详细的个人资料信息,如知识图谱、用户资料和上下文感知信息。数据集通过人工标注确保高质量,旨在解决在语义模糊的实际场景中,传统基于文本的口语理解模型可能无法准确识别意图和槽位的问题。该数据集的应用领域主要集中在提高对话系统在复杂环境下的理解和响应能力,特别是在用户意图不明确或语句具有多重含义的情况下。
arXiv 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录