Fraud Detection in E-commerce Transactions|电子商务数据集|欺诈检测数据集
收藏
- 首次发表关于电子商务交易欺诈检测的研究论文,提出基于机器学习的初步模型。
- 引入深度学习技术,显著提升欺诈检测的准确率,成为该领域的关键技术突破。
- 发布首个公开的电子商务交易欺诈检测数据集,促进学术界和工业界的研究与应用。
- 结合实时数据流处理技术,实现欺诈检测系统的实时响应能力,大幅提高系统的实用性和效率。
- 利用联邦学习技术,保护用户隐私的同时提升欺诈检测模型的性能,成为隐私保护与数据安全的重要里程碑。
- 1Fraud Detection in E-commerce Transactions: A Comprehensive ReviewIEEE · 2021年
- 2A Deep Learning Approach for Fraud Detection in E-commerce TransactionsElsevier · 2020年
- 3Machine Learning Techniques for Fraud Detection in E-commerce: A Comparative StudySpringer · 2019年
- 4Real-time Fraud Detection in E-commerce Using Graph Neural NetworksarXiv · 2022年
- 5Fraud Detection in E-commerce: A Survey of Machine Learning ApproachesACM · 2021年
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
Open-industrial-datasets
一个开放的工业应用数据集集合,按类别划分。欢迎提出拉取请求。如果数据集页面已经链接到论文,则不会包含论文链接。
github 收录
RESIDE
由合成图像和真实世界的模糊图像组成的新的大规模基准,称为真实单图像去雾(RESIDE)。 RESIDE 突出了不同的数据源和图像内容,分为五个子集,每个子集服务于不同的训练或评估目的。
OpenDataLab 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录