five

sacramento-campaign-finance

收藏
github2024-05-21 更新2024-05-31 收录
下载链接:
https://github.com/code4sac/sacramento-campaign-finance
下载链接
链接失效反馈
官方服务:
资源简介:
从城市和县级的竞选财务网站提取数据,展示每个候选人在各竞选中的总筹资额和所有捐赠者信息。

Data extracted from city and county campaign finance websites, showcasing the total fundraising amounts for each candidate in various campaigns, along with information on all donors.
创建时间:
2023-04-20
原始信息汇总

数据集概述

数据来源

  • 数据集从Sacramento市和县的竞选财务网站提取数据。

数据内容

  • 显示每位候选人在各竞选中的总筹款额及所有捐赠者信息。

数据处理流程

  1. 下载数据:从两个门户网站下载当前年份的数据,保存为ZIP档案。
  2. 解压缩数据:将下载的ZIP文件解压成Excel文件。
  3. 转换数据:将Excel文件转换为一系列.json文件,存储在data/目录中。
  4. 数据加载:将所有数据加载到内存中进行后续聚合处理。
  5. 数据过滤与生成:根据config.js文件中的委员会信息,过滤数据并创建$lib/data.json文件。

数据更新

  • 数据集通过GitHub Actions自动更新,具体操作在update-data.yml工作流中定义。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建方式基于Node.js环境下的自动化脚本执行。具体而言,数据集通过调用`scripts/index.js`脚本,从城市和县级的竞选财务网站下载当前年份的数据,通常以ZIP格式存档。随后,脚本解压这些文件并将其转换为Excel格式,再进一步处理为一系列JSON文件,存储于`data/`目录中。最后,通过内存加载和过滤,生成`$lib/data.json`文件,该文件包含了根据`config.js`配置筛选出的候选人及当选官员的相关财务数据。
特点
此数据集的显著特点在于其自动化和实时更新能力。通过GitHub Actions的持续集成,数据集能够定期从官方网站获取最新数据,确保信息的时效性和准确性。此外,数据集采用JSON格式存储,便于数据的高效读取和处理,同时也支持多种数据分析和可视化工具的使用。
使用方法
使用该数据集前,用户需确保本地环境已安装Node.js及npm包管理器。通过运行`nvm use`命令激活项目所需的Node版本,并执行`npm install`安装依赖项。随后,用户可选择运行`npm run dev`启动开发服务器,访问默认地址`http://127.0.0.1:3000/`以查看数据。对于数据生成,用户需执行`node scripts/index.js`命令,按照预设的抓取和转换流程生成最新的数据文件。
背景与挑战
背景概述
sacramento-campaign-finance数据集由Code for Sacramento团队创建,旨在从萨克拉门托市和县的竞选财务网站中提取数据,展示每位候选人在各竞选中的总筹款额及所有捐赠者信息。该数据集的构建始于对竞选财务透明度的追求,旨在为公众提供一个透明的视角,以监督和分析竞选资金的使用情况。通过自动化数据抓取和转换过程,该数据集不仅提高了数据获取的效率,还为相关研究提供了丰富的数据资源,对竞选财务分析领域产生了积极影响。
当前挑战
sacramento-campaign-finance数据集在构建过程中面临多项挑战。首先,数据抓取过程依赖于外部网站的结构和稳定性,任何网站结构的变动都可能导致数据抓取失败。其次,数据转换过程中需要处理多种格式的数据文件,如Excel文件,这要求高效的文件处理和转换技术。此外,数据集的更新频率和准确性也是一大挑战,确保数据实时性和准确性对于维持数据集的可靠性至关重要。最后,数据隐私和安全问题也是不可忽视的挑战,如何在数据公开的同时保护捐赠者和候选人的隐私信息,是该数据集需要持续关注的问题。
常用场景
经典使用场景
在政治竞选分析领域,Sacramento campaign finance数据集被广泛用于揭示竞选资金流动的透明度。该数据集通过整合城市和县级的竞选财务网站数据,展示了每位候选人在各竞选活动中筹集的总金额及其所有捐赠者的详细信息。这一数据集的经典使用场景包括竞选资金来源的追踪、捐赠模式的分析以及竞选策略的评估,为政治科学研究者和政策分析师提供了宝贵的数据支持。
解决学术问题
Sacramento campaign finance数据集在学术研究中解决了竞选资金透明度和政治捐赠行为分析的关键问题。通过详细记录每位候选人的捐赠来源和金额,该数据集为研究者提供了深入分析竞选资金对选举结果影响的可能性。此外,它还促进了关于竞选资金监管和政治透明度的学术讨论,为政策制定提供了科学依据。
衍生相关工作
Sacramento campaign finance数据集的发布催生了一系列相关研究和工作。例如,有研究者利用该数据集开发了竞选资金预测模型,以预测未来竞选活动的资金需求和可能的捐赠趋势。此外,该数据集还激发了对竞选资金监管政策的进一步探讨,推动了相关法律法规的完善和实施。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作