cajcodes/political-bias

Name: cajcodes/political-bias
Creator: cajcodes
Published: 2024-05-17 15:14:43
License: 暂无描述

Hugging Face2024-05-17 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/cajcodes/political-bias

下载链接

链接失效反馈

官方服务：

资源简介：

`Political Bias`数据集包含658条合成的陈述，每条陈述都带有从0到4的偏见评分，评分范围从高度保守（0）到高度自由（4）。该数据集使用GPT-4生成，旨在促进文本数据中偏见检测和减少的研究和开发。数据集的结构为CSV文件，包含`text`和`label`两列。`text`列包含陈述文本，`label`列包含偏见评分。该数据集可用于训练和评估旨在检测和减少文本中政治偏见的模型，特别适用于文本分类、偏见缓解和情感分析等任务。

提供机构：

cajcodes

原始信息汇总

数据集概述

基本信息

名称: Political Bias Dataset
任务类别: 文本分类
任务ID: 多类分类
语言: 英语
许可证: MIT

数据集描述

内容: 包含658个合成声明，每个声明都附有一个从0到4的偏见评分，代表从高度保守（0）到高度自由（4）的政治倾向。
生成方式: 使用GPT-4生成，旨在促进文本数据中偏见检测和减少的研究和开发。
特别关注: 区分两端的中等偏见，这已被证明比识别极端偏见更具挑战性。

数据集结构

格式: CSV文件
列:
- text: 声明文本
- label: 偏见评分，整数，范围0到4

使用场景

用途: 用于训练和评估旨在检测和减少文本中政治偏见的模型。
适用任务: 文本分类、偏见缓解和情感分析。

示例代码

加载数据集: 使用Pandas库加载CSV文件。
模型训练: 使用Transformer模型（如DistilBert和Roberta）进行文本分类训练。

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集