contemmcm/ag_news
收藏Hugging Face2024-04-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/contemmcm/ag_news
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:original和top4-balanced。每个配置都有多个特征,包括来源、URL、标题、图片、类别、描述、排名、发布日期、文本和标签。original配置的标签有14个类别,而top4-balanced配置的标签有4个类别。数据集的文件路径为data/original.csv和data/top4-balanced.csv。
该数据集包含两个配置:original和top4-balanced。每个配置都有多个特征,包括来源、URL、标题、图片、类别、描述、排名、发布日期、文本和标签。original配置的标签有14个类别,而top4-balanced配置的标签有4个类别。数据集的文件路径为data/original.csv和data/top4-balanced.csv。
提供机构:
contemmcm
原始信息汇总
数据集概述
数据集配置
配置一:original
- 数据文件路径:"data/original.csv"
- 默认配置:是
配置二:top4-balanced
- 数据文件路径:"data/top4-balanced.csv"
- 默认配置:否
特征描述
配置一:original
- source:字符串
- url:字符串
- title:字符串
- image:字符串
- category:字符串
- description:字符串
- rank:整数(int32)
- pubdate:字符串
- text:字符串
- label:分类标签
- 类别名称:
- 0: Business
- 1: Entertainment
- 2: Europe
- 3: Health
- 4: Italia
- 5: Music Feeds
- 6: Sci/Tech
- 7: Software and Developement
- 8: Sports
- 9: Toons
- 10: Top News
- 11: Top Stories
- 12: U.S.
- 13: World
- 类别名称:
配置二:top4-balanced
- source:字符串
- url:字符串
- title:字符串
- image:字符串
- category:字符串
- description:字符串
- rank:整数(int32)
- pubdate:字符串
- text:字符串
- label:分类标签
- 类别名称:
- 0: World
- 1: Sports
- 2: Business
- 3: Sci/Tech
- 类别名称:



