该数据集可通过下载链接跳转到国家科技资源共享服务平台后根据要求申请下载。需要注册平台账号后加入数据订单并填写数据使用用途后待人工审核后下载。
THUCNews
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/laomagic/thucnewsproject
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含10个类别的中文新闻分类数据集,非常适合用于中文文本分类任务。其任务类型为传统的样本分类。
This dataset is a 10-category Chinese news classification dataset, which is highly suitable for Chinese text classification tasks. Its task type is traditional sample classification.
提供机构:
THUC
搜集汇总
数据集介绍

背景与挑战
背景概述
THUCNews是一个包含84万篇新闻文档的中文文本分类数据集,涵盖14个类别,适用于文本分类和词向量训练等任务。
以上内容由遇见数据集搜集并总结生成



