PsyMatrix/cls_agnews_TextVsLabel__BaseDefault
收藏Hugging Face2024-06-19 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/PsyMatrix/cls_agnews_TextVsLabel__BaseDefault
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于文本分类任务的英语数据集,数据规模在10K到100K之间。数据集包含两个特征:text和label。text特征表示文本内容,数据类型为字符串;label特征表示文本的类别标签,包含14个类别,分别代表不同的主题,如商业、娱乐、欧洲、健康、意大利、音乐、科技、软件开发、体育、卡通、头条新闻、热门故事、美国和世界。
这是一个用于文本分类任务的英语数据集,数据规模在10K到100K之间。数据集包含两个特征:text和label。text特征表示文本内容,数据类型为字符串;label特征表示文本的类别标签,包含14个类别,分别代表不同的主题,如商业、娱乐、欧洲、健康、意大利、音乐、科技、软件开发、体育、卡通、头条新闻、热门故事、美国和世界。
提供机构:
PsyMatrix
原始信息汇总
数据集概述
任务类别
- 文本分类
语言
- 英语
数据集大小
- 10K<n<100K
数据集特征
- text: 文本数据,数据类型为字符串。
- label: 标签数据,数据类型为类别标签,包含以下类别:
- 0: Business
- 1: Entertainment
- 2: Europe
- 3: Health
- 4: Italia
- 5: Music Feeds
- 6: Sci/Tech
- 7: Software and Developement
- 8: Sports
- 9: Toons
- 10: Top News
- 11: Top Stories
- 12: U.S.
- 13: World



