政治偏见测量数据集
收藏arXiv2025-03-20 更新2025-03-25 收录
下载链接:
http://arxiv.org/abs/2503.16148v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含88,110条观察的政治偏见测量数据集,由康斯坦茨大学、曼海姆大学和巴塞罗那超级计算中心的研究人员创建。数据集通过三十种不同的提示变体,对十一种开源和商业生成型大型语言模型进行了政治偏见评估,旨在研究这些模型在处理政治声明时的立场和偏见。数据集的创建过程中,研究人员使用了世界价值观调查(WVS)和政冶指南针测试(PCT)中的政治声明,并利用GPT-4模型对声明进行改写和反转,以测试模型在不同政治立场上的反应。该数据集用于分析和测量大型语言模型的政治偏见,有助于解决模型在信息收集、搜索或内容分析相关任务中可能存在的政治偏见问题。
This is a political bias measurement dataset containing 88,110 observations, developed by researchers from the University of Konstanz, the University of Mannheim, and the Barcelona Supercomputing Center. It evaluated eleven open-source and commercial generative large language models using thirty distinct prompt variants, aiming to investigate the stances and biases of these models when processing political statements. During the dataset development process, researchers adopted political statements from the World Values Survey (WVS) and the Political Compass Test (PCT), and used the GPT-4 model to rewrite and invert these statements to test the models' responses across different political stances. This dataset is employed to analyze and measure political biases in large language models, helping to address potential political bias issues in tasks related to information gathering, search, or content analysis.
提供机构:
康斯坦茨大学, 曼海姆大学, 巴塞罗那超级计算中心
创建时间:
2025-03-20
搜集汇总
数据集介绍

构建方式
政治偏见测量数据集的构建基于政治学理论,采用世界价值观调查(WVS)和政治指南针测试(PCT)中的政治声明作为数据源。研究团队通过手动标注和GPT-4的辅助,对89条政治声明进行了重新表述和反向表述,以测试模型对不同政治立场的反应。此外,研究还设计了10种不同的提示前缀,以评估模型在不同提示下的反应差异,最终生成了88,110条模型回答。
特点
该数据集的特点在于其理论驱动性和多样性。首先,数据集基于世界价值观调查这一科学有效的调查工具,确保了政治偏见的测量具有高度的构念效度。其次,数据集涵盖了多种提示变体,能够全面评估模型在不同情境下的政治偏见表现。此外,数据集还区分了经济和文化两个维度的政治偏见,提供了更为细致的分析视角。
使用方法
该数据集的使用方法主要包括三个步骤:首先,研究人员可以通过不同的提示前缀和声明变体生成模型的回答;其次,利用训练好的立场分类器对模型的回答进行自动分类,提取其政治立场;最后,根据分类结果计算模型的政治偏见分数。数据集适用于评估大型语言模型在不同政治议题上的偏见程度,以及研究提示敏感性对偏见测量的影响。
背景与挑战
背景概述
政治偏见测量数据集由康斯坦茨大学的Mats Faulborn、David Garcia等学者于2025年提出,旨在构建基于政治学理论的系统性评估框架。该数据集创新性地整合了世界价值观调查(WVS)的科学测量条目,突破了传统政治罗盘测试(PCT)的方法论局限,通过88,110条模型响应数据,为分析GPT-4、LLaMA等大语言模型的政治倾向提供了实证基础。其核心价值在于建立了首个融合政治学维度理论(经济-文化二维度)与提示工程敏感性的评估体系,对人工智能伦理、内容审核等领域的偏见检测研究具有开创性意义。
当前挑战
该数据集面临双重挑战:在领域问题层面,需解决大语言模型在政治新闻摘要、投票建议等场景中隐含意识形态偏差的量化难题,传统单维度测量工具难以捕捉经济与文化立场的复杂交织;在构建过程中,研究者需克服三大技术障碍——提示模板变异性导致测量结果不稳定(如情感诱导前缀使GPT-3.5偏差值波动达0.4)、开放文本应答的立场自动分类准确率不足(零样本分类器F1仅0.47),以及PCT非科学条目与WVS标准化条目间的测量信度差异(Kendall's τ=0.6)。
常用场景
经典使用场景
政治偏见测量数据集在自然语言处理领域中被广泛用于评估大型语言模型(LLMs)的政治倾向性。该数据集通过科学有效的调查工具(如世界价值观调查)和多样化的提示变体,为研究人员提供了一个标准化的框架,用以检测和分析模型在生成文本时可能存在的政治偏见。其经典使用场景包括模型偏见审计、政治立场分类以及提示敏感性分析,为语言模型的公平性和中立性研究提供了重要数据支持。
实际应用
在实际应用中,政治偏见测量数据集被用于优化语言模型在政治敏感场景中的表现,例如新闻摘要生成、投票建议系统和政治内容分析。通过识别模型的政治倾向,开发者可以调整训练数据或设计去偏算法,确保模型在政治新闻报道、公共政策讨论等任务中保持中立。此外,该数据集还为政策制定者评估语言技术的社会影响提供了实证依据。
衍生相关工作
该数据集衍生了一系列关于语言模型政治偏见的研究工作。例如,Feng等人(2023)利用类似方法分析了预训练数据到下游任务中的政治偏见传递路径;Röttger等人(2024)则基于提示敏感性研究了模型政治立场的稳定性。此外,数据集启发了跨文化价值观比较(Arora等,2023)和投票建议系统偏见检测(Ceron等,2024)等创新研究方向,推动了算法公平性领域的多维度探索。
以上内容由遇见数据集搜集并总结生成



