five

contemmcm/ag_news

收藏
Hugging Face2024-04-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/contemmcm/ag_news
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置:original和top4-balanced。每个配置都有多个特征,包括来源、URL、标题、图片、类别、描述、排名、发布日期、文本和标签。original配置的标签有14个类别,而top4-balanced配置的标签有4个类别。数据集的文件路径为data/original.csv和data/top4-balanced.csv。

该数据集包含两个配置:original和top4-balanced。每个配置都有多个特征,包括来源、URL、标题、图片、类别、描述、排名、发布日期、文本和标签。original配置的标签有14个类别,而top4-balanced配置的标签有4个类别。数据集的文件路径为data/original.csv和data/top4-balanced.csv。
提供机构:
contemmcm
原始信息汇总

数据集概述

数据集配置

配置一:original

  • 数据文件路径:"data/original.csv"
  • 默认配置:是

配置二:top4-balanced

  • 数据文件路径:"data/top4-balanced.csv"
  • 默认配置:否

特征描述

配置一:original

  • source:字符串
  • url:字符串
  • title:字符串
  • image:字符串
  • category:字符串
  • description:字符串
  • rank:整数(int32)
  • pubdate:字符串
  • text:字符串
  • label:分类标签
    • 类别名称
      • 0: Business
      • 1: Entertainment
      • 2: Europe
      • 3: Health
      • 4: Italia
      • 5: Music Feeds
      • 6: Sci/Tech
      • 7: Software and Developement
      • 8: Sports
      • 9: Toons
      • 10: Top News
      • 11: Top Stories
      • 12: U.S.
      • 13: World

配置二:top4-balanced

  • source:字符串
  • url:字符串
  • title:字符串
  • image:字符串
  • category:字符串
  • description:字符串
  • rank:整数(int32)
  • pubdate:字符串
  • text:字符串
  • label:分类标签
    • 类别名称
      • 0: World
      • 1: Sports
      • 2: Business
      • 3: Sci/Tech
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作