five

THUCNews

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/laomagic/thucnewsproject
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含10个类别的中文新闻分类数据集,非常适合用于中文文本分类任务。其任务类型为传统的样本分类。

This dataset is a 10-category Chinese news classification dataset, which is highly suitable for Chinese text classification tasks. Its task type is traditional sample classification.
提供机构:
THUC
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
THUCNews是一个包含84万篇新闻文档的中文文本分类数据集,涵盖14个类别,适用于文本分类和词向量训练等任务。
以上内容由遇见数据集搜集并总结生成

社区讨论

该数据集可通过下载链接跳转到国家科技资源共享服务平台后根据要求申请下载。需要注册平台账号后加入数据订单并填写数据使用用途后待人工审核后下载。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作