five

cajcodes/political-bias

收藏
Hugging Face2024-05-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/cajcodes/political-bias
下载链接
链接失效反馈
官方服务:
资源简介:
`Political Bias`数据集包含658条合成的陈述,每条陈述都带有从0到4的偏见评分,评分范围从高度保守(0)到高度自由(4)。该数据集使用GPT-4生成,旨在促进文本数据中偏见检测和减少的研究和开发。数据集的结构为CSV文件,包含`text`和`label`两列。`text`列包含陈述文本,`label`列包含偏见评分。该数据集可用于训练和评估旨在检测和减少文本中政治偏见的模型,特别适用于文本分类、偏见缓解和情感分析等任务。

`Political Bias`数据集包含658条合成的陈述,每条陈述都带有从0到4的偏见评分,评分范围从高度保守(0)到高度自由(4)。该数据集使用GPT-4生成,旨在促进文本数据中偏见检测和减少的研究和开发。数据集的结构为CSV文件,包含`text`和`label`两列。`text`列包含陈述文本,`label`列包含偏见评分。该数据集可用于训练和评估旨在检测和减少文本中政治偏见的模型,特别适用于文本分类、偏见缓解和情感分析等任务。
提供机构:
cajcodes
原始信息汇总

数据集概述

基本信息

  • 名称: Political Bias Dataset
  • 任务类别: 文本分类
  • 任务ID: 多类分类
  • 语言: 英语
  • 许可证: MIT

数据集描述

  • 内容: 包含658个合成声明,每个声明都附有一个从0到4的偏见评分,代表从高度保守(0)到高度自由(4)的政治倾向。
  • 生成方式: 使用GPT-4生成,旨在促进文本数据中偏见检测和减少的研究和开发。
  • 特别关注: 区分两端的中等偏见,这已被证明比识别极端偏见更具挑战性。

数据集结构

  • 格式: CSV文件
  • :
    • text: 声明文本
    • label: 偏见评分,整数,范围0到4

使用场景

  • 用途: 用于训练和评估旨在检测和减少文本中政治偏见的模型。
  • 适用任务: 文本分类、偏见缓解和情感分析。

示例代码

  • 加载数据集: 使用Pandas库加载CSV文件。
  • 模型训练: 使用Transformer模型(如DistilBert和Roberta)进行文本分类训练。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作