电信诈骗五分类数据集
收藏阿里云天池2026-06-09 更新2025-04-19 收录
下载链接:
https://tianchi.aliyun.com/dataset/201837
下载链接
链接失效反馈官方服务:
资源简介:
label00-last.csv is normal text.
label01-last.csv is public security fraud.
label02-last.csv is loans.
label03-last.csv is impersonating customer service.
label04-last.csv is impersonating leadership acquaintances.
该数据集仅供以下用途使用: 高校、科研机构在科学研究中使用。
该数据集禁止用于任何商业目的,不提供任何形式的商业授权。
使用评测数据进行科学研究,发表论文或其他材料时应注明来源信息,如: Li, J.; Zhang, C.; Jiang, L. Innovative Telecom Fraud Detection: A New Dataset and an Advanced Model with RoBERTa and Dual Loss Functions. Appl. Sci. 2024, 14, 11628. https://doi.org/10.3390/app142411628
各数据文件对应的文本类别如下:
`label00-last.csv` 包含正常文本;
`label01-last.csv` 对应公共安全诈骗类文本;
`label02-last.csv` 对应贷款类诈骗文本;
`label03-last.csv` 对应冒充客服类诈骗文本;
`label04-last.csv` 对应冒充领导熟人类诈骗文本。
本数据集仅可用于高等院校、科研机构的科学研究工作。
本数据集严禁用于任何商业用途,且不提供任何形式的商业授权。
若使用本数据集开展科学研究并发表论文或其他学术成果,需注明数据集来源,示例如下:Li, J.; Zhang, C.; Jiang, L. Innovative Telecom Fraud Detection: A New Dataset and an Advanced Model with RoBERTa and Dual Loss Functions. Appl. Sci. 2024, 14, 11628. https://doi.org/10.3390/app142411628
提供机构:
阿里云天池
创建时间:
2025-04-17
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于电信诈骗检测的文本分类数据集,包含五个类别:正常文本、公安诈骗、贷款诈骗、冒充客服诈骗和冒充领导熟人诈骗。数据集大小为1.19MB,适用于高校和科研机构的非商业科学研究,并需在相关成果中引用指定的学术论文作为来源。
以上内容由遇见数据集搜集并总结生成



