Reuters-21578 文本分类数据集
收藏超神经2023-09-12 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/4945
下载链接
链接失效反馈官方服务:
资源简介:
Reuters – 21578 Dataset 是用于文本分类研究的测试集合,它是一个多类、多标签数据集,其有望在未来几年被 RCV1 取代,该数据集有 90 个类、 7769 个训练文件和 3019 个测试文件,是 Reuters – 21578 基准的 ModApte 子目录。
The Reuters – 21578 Dataset is a benchmark collection for text classification research. As a multiclass and multilabel dataset, it was expected to be replaced by RCV1 in the coming years. It comprises 90 classes, 7769 training documents and 3019 test documents, and corresponds to the ModApte subset of the Reuters – 21578 benchmark.
创建时间:
2023-04-20
搜集汇总
数据集介绍

背景与挑战
背景概述
Reuters-21578是一个多类、多标签的文本分类测试集合,包含90个类别,共有7769个训练文件和3019个测试文件,源自Reuters-21578基准的ModApte子目录。该数据集由Carnegie Group和Reuters于1987年收集,1997年由AT&T Labs Research发布,主要用于文本分类研究。
以上内容由遇见数据集搜集并总结生成



