five

PsyMatrix/cls_20newsgroups_SubjectVsLabel__BaseDefault

收藏
Hugging Face2024-06-19 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/PsyMatrix/cls_20newsgroups_SubjectVsLabel__BaseDefault
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于文本分类任务的英语数据集,包含文本和标签两个特征。标签共有20个类别,涵盖了多个主题,如计算机、宗教、体育等。数据集的大小在10K到100K之间。

该数据集是一个用于文本分类任务的英语数据集,包含文本和标签两个特征。标签共有20个类别,涵盖了多个主题,如计算机、宗教、体育等。数据集的大小在10K到100K之间。
提供机构:
PsyMatrix
原始信息汇总

数据集概述

任务类别

  • 文本分类

语言

  • 英语

数据集信息

特征

  • text: 文本数据,数据类型为字符串。
  • label: 标签数据,数据类型为类别标签。

标签类别

  • 0: alt.atheism
  • 1: comp.graphics
  • 2: comp.os.ms-windows.misc
  • 3: comp.sys.ibm.pc.hardware
  • 4: comp.sys.mac.hardware
  • 5: comp.windows.x
  • 6: misc.forsale
  • 7: rec.autos
  • 8: rec.motorcycles
  • 9: rec.sport.baseball
  • 10: rec.sport.hockey
  • 11: sci.crypt
  • 12: sci.electronics
  • 13: sci.med
  • 14: sci.space
  • 15: soc.religion.christian
  • 16: talk.politics.guns
  • 17: talk.politics.mideast
  • 18: talk.politics.misc
  • 19: talk.religion.misc

数据集规模

  • 10K < n < 100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作