trec06c中文邮件数据集
收藏阿里云天池2026-06-09 更新2025-06-21 收录
下载链接:
https://tianchi.aliyun.com/dataset/207249
下载链接
链接失效反馈官方服务:
资源简介:
包含 64,000+ 封真实中文邮件(含垃圾邮件与正常邮件)。邮件保留原始格式与内容,涵盖多种文本类型(如广告、诈骗、通知等)。
官方下载地址: https://plg.uwaterloo.ca/cgi-bin/cgiwrap/gvcormac/foo06
Contains over 64,000 real Chinese emails, including both spam and legitimate emails. The emails retain their original formatting and content, covering various text types such as advertisements, scams, notifications, and more. Official download link: https://plg.uwaterloo.ca/cgi-bin/cgiwrap/gvcormac/foo06
提供机构:
阿里云天池
创建时间:
2025-06-19
搜集汇总
数据集介绍

背景与挑战
背景概述
trec06c中文邮件数据集是一个包含超过64,000封真实中文邮件的大型数据集,涵盖垃圾邮件和正常邮件,邮件保留原始格式与内容,适用于文本分类和垃圾邮件检测研究。数据集提供结构化存储和标注文件,标签类型明确,支持机器学习模型的训练与评估。
以上内容由遇见数据集搜集并总结生成



