mediabiasgroup/BABE
收藏Hugging Face2024-04-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mediabiasgroup/BABE
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于文本分类任务,涉及的主题包括主观性、媒体偏见等。数据集包含多个特征,如文本、媒体机构、标签、主题、新闻链接、偏见词汇、唯一标识符、类型和观点标签。数据集分为训练集和测试集,分别包含3121和1000个样本。
该数据集主要用于文本分类任务,涉及的主题包括主观性、媒体偏见等。数据集包含多个特征,如文本、媒体机构、标签、主题、新闻链接、偏见词汇、唯一标识符、类型和观点标签。数据集分为训练集和测试集,分别包含3121和1000个样本。
提供机构:
mediabiasgroup
原始信息汇总
数据集概述
任务类别
- 文本分类
语言
- 英语
标签
- 主观性
- 媒体偏见
- 媒体偏见
数据集特征
- text:文本,数据类型为字符串
- outlet:出口,数据类型为字符串
- label:标签,数据类型为int32
- topic:主题,数据类型为字符串
- news_link:新闻链接,数据类型为字符串
- biased_words:偏见词汇,数据类型为字符串
- uuid:通用唯一识别码,数据类型为字符串
- type:类型,数据类型为字符串
- label_opinion:观点标签,数据类型为字符串
数据集划分
- 训练集:
- 示例数量:3121
- 数据大小:1333005字节
- 测试集:
- 示例数量:1000
- 数据大小:431960字节
数据集大小
- 下载大小:945249字节
- 总大小:1764965字节
配置
- 默认配置:
- 训练数据路径:
data/train-* - 测试数据路径:
data/test-*
- 训练数据路径:



