five

Diputados (1993-2019), Senadores (2010-2019), Unificados

收藏
github2024-03-24 更新2024-05-31 收录
下载链接:
https://github.com/nahuelhds/votaciones-ar-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了阿根廷众议院和参议院的投票信息,时间跨度从1993年到2019年。数据集提供了多种格式,包括CSV、JSON、MySQL和SQLite,以便社区使用。此外,还有一个统一的数据集,旨在未来构建一个集中的API。

This dataset encompasses voting records from both the Chamber of Deputies and the Senate of Argentina, spanning from 1993 to 2019. It is available in multiple formats, including CSV, JSON, MySQL, and SQLite, to facilitate community usage. Additionally, there is a consolidated dataset intended for the future development of a centralized API.
创建时间:
2019-04-21
原始信息汇总

数据集概述

数据集名称

  • Datos Abiertos de las votaciones de Argentina

数据集内容

  • 包含阿根廷国会的投票数据。

数据集格式

  • Diputados (1993-2019)
    • CSV
    • JSON
  • Senadores (2010-2019)
    • CSV
    • JSON
  • Unificados
    • CSV
    • JSON
    • MySQL
    • SQLite

数据集结构

  • Unificados 文件夹中的数据采用统一的规范化结构,旨在未来构建中央API。

数据集状态

  • Unificados 部分正在处理中,目前仅包含Diputados的数据。

数据集使用

  • 数据可通过提供的docker-compose在本地可视化。
  • 需要安装docker和docker-compose,并通过命令docker-compose up启动。
  • 访问地址包括:
    • Grafana: http://localhost:3001
    • Metabase: http://localhost:3000
    • MySQL: localhost:3306

数据集贡献

  • 欢迎通过Pull Request或其他方式进行贡献。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建过程采用了自动化技术,通过Puppeteer库编写的爬虫程序,访问阿根廷国会官方网站,逐年抓取议员投票记录。爬虫程序深入每个年份的页面,记录每项法律的详细信息,并下载相关数据。随后,这些数据被整合并转化为SQL数据库,以便于系统化、标准化和关联化处理,最终形成统一的数据集。
特点
Diputados (1993-2019), Senadores (2010-2019), Unificados数据集涵盖了阿根廷国会众议院和参议院多年的投票记录,提供了CSV、JSON、MySQL和SQLite等多种数据格式,便于不同技术背景的研究者使用。数据集的特点在于其全面性和多样性,不仅包含详细的投票信息,还通过统一的结构化处理,为未来的API开发奠定了基础。
使用方法
该数据集的使用方法灵活多样,用户可以通过提供的CSV、JSON、MySQL和SQLite文件直接进行数据分析。此外,项目还提供了Docker-compose配置,用户可以通过简单的命令行操作,在本地启动Grafana和Metabase等数据可视化工具,实时查看和分析数据。对于需要直接查询数据库的用户,MySQL服务已在本地端口3306上运行,用户可以使用提供的凭据进行访问。
背景与挑战
背景概述
Diputados (1993-2019), Senadores (2010-2019), Unificados数据集是由阿根廷国会投票数据构成的开放数据集,由研究人员nahuelhds创建并维护。该数据集涵盖了1993年至2019年众议院以及2010年至2019年参议院的投票记录,旨在为公众提供透明、可访问的立法数据。其核心研究问题聚焦于阿根廷立法者的投票行为、党派联盟的动态变化以及法律通过的过程。通过系统化、规范化这些数据,该数据集为政治学、社会学及数据科学领域的研究提供了宝贵的资源,推动了阿根廷开放数据运动的发展。
当前挑战
该数据集在构建过程中面临多重挑战。首先,数据采集依赖于自动化工具Puppeteer,需从阿根廷国会官方网站逐页抓取信息,这一过程不仅耗时,还需应对网页结构变化带来的技术难题。其次,数据的规范化与整合是另一大挑战,尤其是将众议院和参议院的数据统一为一致的格式,以便未来构建集中化的API。此外,数据的完整性与准确性也需持续验证,以确保其能够支持深入的数据挖掘与分析。最后,尽管数据集已提供了多种格式(如CSV、JSON、SQL),但其应用范围仍受限于用户的技术能力,如何进一步降低使用门槛,扩大其影响力,是未来需要解决的问题。
常用场景
经典使用场景
Diputados (1993-2019)和Senadores (2010-2019)数据集为研究阿根廷国会投票行为提供了详实的历史数据。这些数据集广泛应用于政治学、社会学和公共政策研究领域,帮助学者分析立法者的投票模式、党派联盟的动态变化以及政策制定的趋势。通过CSV和JSON格式的数据,研究者可以轻松进行数据清洗、统计分析和可视化,从而深入理解阿根廷政治生态的演变。
实际应用
在实际应用中,Diputados和Senadores数据集为政府机构、智库和媒体提供了重要的数据支持。政府可以利用这些数据评估政策的通过率和立法者的支持度,智库可以基于数据发布政策研究报告,媒体则能够通过数据可视化向公众展示国会投票的动态。此外,数据集还为公民社会组织提供了监督立法者行为的工具,增强了政治透明度和公众参与度。
衍生相关工作
该数据集衍生了一系列经典研究工作,包括基于投票数据的党派联盟分析、立法者行为模式预测以及政策通过率的影响因素研究。例如,有学者利用这些数据构建了阿根廷国会投票网络的模型,揭示了党派内部和跨党派合作的复杂性。此外,数据集还被用于开发自动化投票分析工具,为政治咨询和公共政策研究提供了技术支持。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务