mstz/congress
收藏Hugging Face2023-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mstz/congress
下载链接
链接失效反馈官方服务:
资源简介:
Congress数据集来自UCI ML仓库,包含两个不同党派的国会议员对一系列法案的投票情况。任务是根据投票情况猜测每个投票者的党派。
Congress数据集来自UCI ML仓库,包含两个不同党派的国会议员对一系列法案的投票情况。任务是根据投票情况猜测每个投票者的党派。
提供机构:
mstz
原始信息汇总
数据集概述
基本信息
- 名称: Congress
- 语言: 英语
- 标签:
- congress
- tabular_classification
- binary_classification
- UCI
- 大小分类: n<1K
- 任务分类: tabular-classification
- 配置: voting
- 许可证: cc
数据集描述
- 来源: 来自UCI ML仓库的Congress数据集,地址为https://archive.ics.uci.edu/ml/datasets/Congress。
- 内容: 数据集包含两个不同党派的国会议员对一系列法案的投票记录。任务是根据投票记录预测每位议员的党派。
使用示例
python from datasets import load_dataset
dataset = load_dataset("mstz/congress", "voting")["train"]
搜集汇总
数据集介绍

构建方式
在政治学与机器学习交叉领域,国会投票数据集作为经典分类任务资源,其构建源于对现实立法行为的系统化采集。该数据集从美国国会历史记录中提取,聚焦于两党议员对一系列法案的表决结果,每一条记录对应一位议员的投票模式与所属党派标签。数据经过规范化处理,将复杂的政治决策转化为清晰的二元特征,确保了机器学习模型能够有效学习党派与投票行为之间的关联性。
使用方法
使用该数据集时,可通过Hugging Face平台便捷加载,指定'voting'配置以获取训练集。加载后的数据可直接投入分类模型训练,特征矩阵与标签均已预处理完毕。研究者可借此探索投票模式与党派关联性,或作为基准测试不同分类算法的性能。其轻量级特性也便于快速实验与教学演示,为政治行为量化分析提供即用型工具。
背景与挑战
背景概述
国会数据集源于UCI机器学习知识库,由加州大学欧文分校的研究团队于20世纪80年代后期构建,旨在探索政治行为与党派归属之间的关联性。该数据集聚焦于美国国会两党议员对一系列法案的投票记录,核心研究问题在于通过监督学习模型预测议员的党派身份。作为早期政治科学定量研究的代表性资源,它为政治行为模式分析提供了结构化数据基础,推动了机器学习在社会科学领域的交叉应用,对后续的政治倾向预测、投票行为建模等研究产生了深远影响。
当前挑战
该数据集旨在解决政治行为分析中的党派归属预测挑战,即如何从离散的投票行为中准确识别议员的政治派别,这涉及高维稀疏特征下的模式提取与泛化能力问题。在构建过程中,数据采集面临历史记录不完整与投票议题时效性限制,需处理缺失值与类别不平衡;同时,特征编码需将复杂的政治决策简化为二元变量,可能损失议题背景与议员个体差异信息,增加了模型解释的难度。
常用场景
经典使用场景
在政治学与机器学习交叉领域,国会投票数据集常被用于探索党派归属的预测模型构建。该数据集收录了美国国会成员对一系列法案的投票记录,通过二元分类任务,研究者能够分析投票模式与政党倾向之间的关联。这一场景不仅揭示了立法行为中的党派一致性,还为理解政治决策的集体动态提供了量化基础,成为政治行为研究中不可或缺的实证工具。
解决学术问题
该数据集有效解决了政治科学中关于党派忠诚度与投票行为量化分析的经典问题。通过机器学习方法,学者能够检验政党意识形态在立法投票中的显性影响,克服传统定性研究的局限性。其意义在于为政治预测模型提供了标准化基准,推动了计算社会科学的发展,使大规模投票模式分析成为可能,深化了对民主制度运作机制的理解。
实际应用
在实际应用中,国会投票数据集被广泛用于政治竞选策略优化与舆情分析系统。竞选团队可利用历史投票模式预测关键议题的立法走向,从而制定针对性游说方案。媒体与智库则借助该数据监测政党立场演变,生成可视化报告以增强公众政治认知。这些应用不仅提升了政治工程的精确性,也促进了政策制定过程的透明化与民主参与。
数据集最近研究
最新研究方向
在政治科学和机器学习交叉领域,国会投票数据集作为经典的政治行为分析工具,正推动着可解释人工智能和公平性研究的前沿探索。研究者们借助该数据集,深入剖析党派投票模式与立法决策间的复杂关联,结合图神经网络和因果推断方法,揭示政治极化现象背后的动态机制。热点事件如全球选举和立法改革,进一步激发了数据驱动的政治预测模型发展,这些模型不仅提升了党派归属分类的准确性,还为政策制定提供了量化依据,强化了数据科学在社会科学中的实证意义。
以上内容由遇见数据集搜集并总结生成



