five

mediabiasgroup/BABE

收藏
Hugging Face2024-04-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mediabiasgroup/BABE
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于文本分类任务,涉及的主题包括主观性、媒体偏见等。数据集包含多个特征,如文本、媒体机构、标签、主题、新闻链接、偏见词汇、唯一标识符、类型和观点标签。数据集分为训练集和测试集,分别包含3121和1000个样本。

该数据集主要用于文本分类任务,涉及的主题包括主观性、媒体偏见等。数据集包含多个特征,如文本、媒体机构、标签、主题、新闻链接、偏见词汇、唯一标识符、类型和观点标签。数据集分为训练集和测试集,分别包含3121和1000个样本。
提供机构:
mediabiasgroup
原始信息汇总

数据集概述

任务类别

  • 文本分类

语言

  • 英语

标签

  • 主观性
  • 媒体偏见
  • 媒体偏见

数据集特征

  • text:文本,数据类型为字符串
  • outlet:出口,数据类型为字符串
  • label:标签,数据类型为int32
  • topic:主题,数据类型为字符串
  • news_link:新闻链接,数据类型为字符串
  • biased_words:偏见词汇,数据类型为字符串
  • uuid:通用唯一识别码,数据类型为字符串
  • type:类型,数据类型为字符串
  • label_opinion:观点标签,数据类型为字符串

数据集划分

  • 训练集
    • 示例数量:3121
    • 数据大小:1333005字节
  • 测试集
    • 示例数量:1000
    • 数据大小:431960字节

数据集大小

  • 下载大小:945249字节
  • 总大小:1764965字节

配置

  • 默认配置
    • 训练数据路径:data/train-*
    • 测试数据路径:data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作