AG’s Corpus (AG's corpus of news articlesNews)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/AG_s_Corpus
下载链接
链接失效反馈官方服务:
资源简介:
Antonio Gulli 的新闻文章语料库包含超过 100 万篇新闻文章。在一年多的活动中,ComeToMyHead 从 2000 多个新闻来源收集了这些文章。 ComeToMyHead 是一个学术新闻搜索引擎,自 2004 年 7 月开始运行。数据集由学术界提供,用于数据挖掘(聚类、分类等)、信息检索(排名、搜索等)、xml、数据压缩、数据流和任何其他非商业活动。该语料库的一个子集 AG News 由 4 个最大的类组成,是一个流行的主题分类数据集。
提供机构:
OpenDataLab
创建时间:
2022-08-19



