新闻文本挖掘数据集
收藏库帕思2025-12-22 更新2025-12-27 收录
下载链接:
https://www.kupasai.com/corpus/detail?id=587&type=1
下载链接
链接失效反馈官方服务:
资源简介:
20 Newsgroups数据集包含约2万篇新闻文本,涵盖20个不同主题的新闻组,常用于文本分类、聚类和自然语言处理任务。数据规模适中,文本内容真实且类别清晰,具有较高的语义区分度。该数据集适用于大模型预训练中的文本理解与表示学习,支持监督与无监督学习方法,广泛应用于信息检索、主题识别和文本挖掘等领域。
提供机构:
库帕思
创建时间:
2025-12-18



