PsyMatrix/cls_20newsgroups_SubjectVsLabel__BaseDefault
收藏Hugging Face2024-06-19 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/PsyMatrix/cls_20newsgroups_SubjectVsLabel__BaseDefault
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本分类任务的英语数据集,包含文本和标签两个特征。标签共有20个类别,涵盖了多个主题,如计算机、宗教、体育等。数据集的大小在10K到100K之间。
该数据集是一个用于文本分类任务的英语数据集,包含文本和标签两个特征。标签共有20个类别,涵盖了多个主题,如计算机、宗教、体育等。数据集的大小在10K到100K之间。
提供机构:
PsyMatrix
原始信息汇总
数据集概述
任务类别
- 文本分类
语言
- 英语
数据集信息
特征
- text: 文本数据,数据类型为字符串。
- label: 标签数据,数据类型为类别标签。
标签类别
- 0: alt.atheism
- 1: comp.graphics
- 2: comp.os.ms-windows.misc
- 3: comp.sys.ibm.pc.hardware
- 4: comp.sys.mac.hardware
- 5: comp.windows.x
- 6: misc.forsale
- 7: rec.autos
- 8: rec.motorcycles
- 9: rec.sport.baseball
- 10: rec.sport.hockey
- 11: sci.crypt
- 12: sci.electronics
- 13: sci.med
- 14: sci.space
- 15: soc.religion.christian
- 16: talk.politics.guns
- 17: talk.politics.mideast
- 18: talk.politics.misc
- 19: talk.religion.misc
数据集规模
- 10K < n < 100K



