five

knesset-data

收藏
Hugging Face2026-02-10 更新2026-02-11 收录
下载链接:
https://huggingface.co/datasets/ZeAlenu/knesset-data
下载链接
链接失效反馈
官方服务:
资源简介:
以色列国会开放数据集是一个直接从以色列国会官方API获取的开放数据集,以分区的JSONL文件格式存储。数据集包含约150万条记录,涵盖44个数据表,分为8个主要类别:人员与职位、委员会、法案、法律、次级立法、全体会议、质询和议程。具体内容包括国会议员个人信息、委员会会议记录、法案提案、法律文件、投票结果、议会质询等。数据采用CC-BY-SA-4.0许可协议,由ZeAlenu组织维护。数据集结构清晰,每个表都有详细的描述和记录数量统计,适合用于政治学、立法过程分析、政府透明度研究等相关领域。
创建时间:
2026-02-08
原始信息汇总

🇮🇱 以色列议会开放数据

数据集概述

这是一个以色列议会(Knesset)的开放数据集,数据直接来源于官方API,以分区的JSONL文件格式存储。

关键信息

  • 语言: 希伯来语
  • 许可证: ODC-BY / CC-BY-SA-4.0
  • 数据规模: 1M < n < 10M 条记录
  • 标签: 议会, 以色列, 议会, 立法, 政府, 民主, 希伯来语
  • 数据源: Knesset OData API
  • 维护者: ZeAlenu

数据结构

数据集包含44个表,总计约150万条记录,分为以下类别:

👥 人员与职位

  • KNS_Person: 议员个人详细信息 (1,184 条记录)
  • KNS_PersonToPosition: 职位任命 (23,483 条记录)
  • KNS_Position: 职位类型 (29 条记录)
  • KNS_Faction: 党派 (544 条记录)
  • KNS_MkSiteCode: 议员网站代码 (1,111 条记录)

🏢 委员会

  • KNS_Committee: 议会委员会 (2,900 条记录)
  • KNS_CommitteeSession: 委员会会议 (107,740 条记录)
  • KNS_CmtSessionItem: 会议议程项目 (78,329 条记录)
  • KNS_JointCommittee: 联合委员会 (1,174 条记录)
  • KNS_CmtSiteCode: 委员会网站代码 (720 条记录)
  • KNS_BroadcastCommitteSession: 会议广播 (107,752 条记录)
  • KNS_DocumentCommitteeSession: 委员会文件 (196,085 条记录)

📜 法案

  • KNS_Bill: 法案 (59,986 条记录)
  • KNS_BillInitiator: 法案发起人 (169,510 条记录)
  • KNS_BillHistoryInitiator: 发起人历史 (10,390 条记录)
  • KNS_BillName: 法案名称 (27,812 条记录)
  • KNS_BillSplit: 法案拆分 (818 条记录)
  • KNS_BillUnion: 法案合并 (1,563 条记录)
  • KNS_DocumentBill: 法案文件 (110,492 条记录)

⚖️ 法律

  • KNS_IsraelLaw: 以色列法律 (1,993 条记录)
  • KNS_IsraelLawBinding: 法律间关联 (373 条记录)
  • KNS_IsraelLawClassificiation: 法律分类 (2,853 条记录)
  • KNS_IsraelLawMinistry: 负责部门 (1,695 条记录)
  • KNS_IsraelLawName: 法律名称 (2,148 条记录)
  • KNS_LawBinding: 法律引用 (15,046 条记录)
  • KNS_DocumentIsraelLaw: 法律文件 (0 条记录)

📋 次级立法

  • KNS_SecondaryLaw: 法规和命令 (59,876 条记录)
  • KNS_SecLawAuthorizingLaw: 授权法律 (67,827 条记录)
  • KNS_SecLawRegulator: 监管机构 (4,817 条记录)
  • KNS_SecToSecBinding: 法规间关联 (23,763 条记录)
  • KNS_DocumentSecondaryLaw: 次级立法文件 (6,847 条记录)

🎤 全体会议

  • KNS_PlenumSession: 全体会议 (8,743 条记录)
  • KNS_PlmSessionItem: 全体会议议程项目 (167,957 条记录)
  • KNS_PlenumVote: 投票 (34,916 条记录)
  • KNS_PlenumVoteResult: 投票结果 (50 条记录)
  • KNS_DocumentPlenumSession: 全体会议文件 (74,385 条记录)

❓ 质询

  • KNS_Query: 议会质询 (42,620 条记录)
  • KNS_DocumentQuery: 质询文件 (7,134 条记录)

📅 议程

  • KNS_Agenda: 议程项目 (42,141 条记录)
  • KNS_DocumentAgenda: 议程文件 (27,269 条记录)

🔧 参考表

  • KNS_Status: 状态代码 (82 条记录)
  • KNS_ItemType: 项目类型 (8 条记录)
  • KNS_GovMinistry: 政府部门 (922 条记录)
  • KNS_KnessetDates: 议会任期和会期 (164 条记录)

文件结构

数据以JSONL文件格式组织,每个文件最多包含50,000条记录,按Id排序。每个数据目录包含一个manifest.yaml文件,用于描述模式、数据源和校验和。根目录也包含一个manifest.yaml文件,记录数据来源和完整性信息。

搜集汇总
数据集介绍
main_image_url
构建方式
在以色列议会数据开放化的背景下,knesset-data数据集通过官方OData API直接采集构建,确保了数据来源的权威性与实时性。该数据集采用JSONL格式进行结构化存储,每条记录对应一个独立行,并依据唯一标识符Id进行排序,便于高效处理与解析。数据涵盖议会运作的多个维度,包括人员、委员会、法案、法律及会议记录等,总计约150万条记录,分置于44个数据表中,形成了全面且层次分明的数据体系。
特点
knesset-data数据集以其全面的覆盖范围和精细的结构化设计而著称,深入呈现了以色列议会的立法与行政过程。数据集不仅包含议员个人信息、职位任命等基础数据,还详细记录了委员会会议、法案提案、法律条文以及议会投票等动态信息,为政治学与法学研究提供了多维视角。所有数据均以希伯来语呈现,并采用开放许可CC-BY-SA-4.0,支持学术与公众的广泛使用,同时通过分文件存储与清单管理,确保了数据的可访问性与完整性。
使用方法
研究人员可通过下载分区的JSONL文件直接访问knesset-data数据集,每个文件对应特定数据表,并附有描述模式与校验信息的清单文件。数据集适用于自然语言处理、社会网络分析及立法过程建模等多种研究场景,例如利用法案文本进行政策趋势分析,或基于投票记录探究政治联盟行为。在使用过程中,用户需注意数据的希伯来语特性,并遵循开放许可要求进行引用与共享,以支持透明、可复现的学术实践。
背景与挑战
背景概述
以色列议会开放数据集(Knesset Open Data)由非营利组织ZeAlenu于近年创建并维护,其核心研究问题聚焦于如何将以色列议会的官方运作数据——涵盖立法过程、委员会活动、议员信息及投票记录等——进行系统化、结构化的开放获取与整合。该数据集直接源自以色列议会官方OData API,以JSONL格式提供了约150万条记录,涉及44个数据表,全面刻画了议会民主的运作机制。它的出现显著推动了政治科学、计算社会科学及数字人文领域的研究,为学者分析立法行为、政党动态、政策演变及民主透明度提供了高质量、机器可读的一手资料,成为研究以色列政治生态与比较立法制度的重要基础资源。
当前挑战
该数据集旨在解决立法过程与议会活动数据化分析中的核心挑战,即如何从异构、动态且规模庞大的官方记录中,提取出结构化、可关联且时序清晰的信息,以支持复杂的政治网络分析、政策影响力追踪及民主问责研究。在构建过程中,主要挑战包括:第一,对官方API中非结构化或半结构化数据进行清洗、归一化与实体链接,确保数据的一致性与准确性;第二,处理希伯来语文本特有的从右至左书写方向及复杂形态变化,保障多语言环境下的数据处理与标注质量;第三,维护数据与官方源的持续同步,应对API架构变更与数据更新带来的版本控制与完整性难题。
常用场景
经典使用场景
在政治科学与计算社会科学领域,Knesset数据集为研究者提供了以色列议会活动的结构化记录。该数据集经典地应用于立法过程分析,通过追踪法案提案、委员会审议、全会投票等环节,揭示政策制定的动态机制。学者们利用其丰富的时序数据,能够深入探究政党联盟、议员行为与立法产出之间的复杂关联,从而构建出精细化的民主决策模型。
衍生相关工作
围绕该数据集已衍生出多项经典研究工作。在计算政治学领域,学者开发了基于机器学习的法案通过预测模型与政治网络分析框架。在法律信息学方面,研究聚焦于法律文本的自动分类与法规关联图谱构建。此外,跨国的议会数据比较项目也常将Knesset数据集作为关键案例,用以探索立法行为的跨国模式与制度差异。
数据集最近研究
最新研究方向
在数字民主与计算社会科学领域,以色列议会开放数据集(Knesset Open Data)正成为探索立法行为与政治动态的重要资源。该数据集覆盖了从议员信息、委员会会议到法案提案、投票记录等全方位议会活动,为研究者提供了结构化、多模态的政治文本与元数据。当前前沿研究聚焦于利用自然语言处理与网络分析方法,深入挖掘立法过程中的联盟形成、议程设置及政策扩散模式,尤其在多党制与复杂政治生态背景下,这些分析有助于揭示民主决策的微观机制。同时,数据集与近期全球议会开放数据运动相呼应,推动了透明治理与公民参与的热点议题,其多语言(希伯来语)特性也为中东地区政治计算研究提供了独特视角,对理解制度稳定性、政策演变及民主韧性具有显著学术价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作