valurank/Topic_Classification
收藏Hugging Face2024-01-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/valurank/Topic_Classification
下载链接
链接失效反馈官方服务:
资源简介:
News_Topic_Classification数据集包含22,462篇新闻文章,分为120个不同的主题。数据集的结构包括两列:article_text(新闻文章内容)和topic(文章所属主题)。数据集的文本为英文,且是从Otherweb数据库和一些新闻源中抓取,由Otherweb的NLP工程师和GPT-4手动注释。
News_Topic_Classification数据集包含22,462篇新闻文章,分为120个不同的主题。数据集的结构包括两列:article_text(新闻文章内容)和topic(文章所属主题)。数据集的文本为英文,且是从Otherweb数据库和一些新闻源中抓取,由Otherweb的NLP工程师和GPT-4手动注释。
提供机构:
valurank
原始信息汇总
数据集卡片:News_Topic_Classification
数据集描述
该数据集包含22462篇新闻文章,分为120个不同的主题。
语言
数据集中的文本为英语。
数据集结构
数据集包含两列:article_text和topic。article_text列包含新闻文章,topic列包含每篇文章所属的主题。
源数据
数据集从Otherweb数据库、一些新闻来源中抓取,并由Otherweb的NLP工程师和GPT-4手动标注。



