five

guymorlan/IsraParlTweet

收藏
Hugging Face2024-05-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/guymorlan/IsraParlTweet
下载链接
链接失效反馈
官方服务:
资源简介:
IsraParlTweet数据集是一个包含以色列议会(Knesset)1992年至2023年的希伯来语议会讨论和2008年至2023年议会成员的Twitter帖子的链接语料库,总计2.945亿个希伯来语词汇。数据集分为四个主要部分:议会会议、Twitter帖子、办公室会议和语言分析。议会会议部分包含议员的发言记录,Twitter帖子部分包含议员的推文,办公室会议部分包含议员的任职信息,语言分析部分包含对议会发言的句子分割、词干提取和情感分析。数据集还包含详细的元数据和语言注释,适用于多种定量和定性分析,为以色列政治话语提供了宝贵的见解。

IsraParlTweet数据集是一个包含以色列议会(Knesset)1992年至2023年的希伯来语议会讨论和2008年至2023年议会成员的Twitter帖子的链接语料库,总计2.945亿个希伯来语词汇。数据集分为四个主要部分:议会会议、Twitter帖子、办公室会议和语言分析。议会会议部分包含议员的发言记录,Twitter帖子部分包含议员的推文,办公室会议部分包含议员的任职信息,语言分析部分包含对议会发言的句子分割、词干提取和情感分析。数据集还包含详细的元数据和语言注释,适用于多种定量和定性分析,为以色列政治话语提供了宝贵的见解。
提供机构:
guymorlan
原始信息汇总

数据集概述

数据集名称

IsraParlTweet: The Israeli Parliamentary and Twitter Resource

数据集内容

该数据集包含以下四个主要部分:

1. Knesset Sessions

  • 文件名: knesset_speeches.csv
  • 内容: 包含以色列议会(Knesset)成员在议会中的发言,共计约4.5M个独立发言。
  • 字段:
    • text: 发言文本
    • uuid: 唯一文本标识符
    • knesset: 议会任期
    • session_number: 当前议会任期内的会议编号
    • date: 会议日期
    • person_id: 发言人数字标识符
    • canonical_name: 发言人的标准姓名
    • name: 从议会记录中提取的发言人姓名
    • chair: 是否为会议主席
    • topic: 讨论主题或议程项目
    • topic_extra: 主题的额外信息
    • qa: 是否为问答环节
    • query: 口头回答的书面问题
    • only_read: 是否为阅读而非口头回答的问答环节

2. Twitter Posts

  • 访问方式: 需联系作者获取
  • 内容: 包含以色列议会成员在Twitter上的帖子,涵盖2008年至2023年。
  • 字段:
    • text: 推文文本
    • uuid: 唯一文本标识符
    • tweet_id: Twitter的唯一推文标识符
    • date: 推文日期
    • knesset: 与推文日期对应的议会任期
    • person_id: 推文发布者的数字标识符
    • user_id: Twitter用户ID
    • username: Twitter用户名
    • name: 发布者的标准姓名
    • likes: 收集时获得的点赞数
    • retweets: 收集时获得的转发数
    • replies: 收集时获得的回复数
    • quotes: 收集时获得的引用数

3. Office Sessions

  • 文件名: metadata.csv
  • 内容: 描述议会成员办公室会议的元数据。
  • 字段:
    • start_date: 办公室会议开始日期
    • end_date: 办公室会议结束日期
    • knesset: 相关议会任期
    • person_id: 唯一个人ID
    • first_name: 议会成员的名字
    • surname: 议会成员的姓氏
    • gender: 议会成员的性别
    • faction: 议会成员服务的派系名称
    • faction_id: 派系的唯一标识符
    • party_name: 议会成员服务的统一党派名称
    • dob: 议会成员的出生日期
    • cob: 议会成员的出生国家
    • yod: 议会成员的死亡年份
    • yoi: 议会成员移民至以色列的年份
    • city: 议会成员的居住城市
    • languages: 议会成员的口语语言

4. Linguistic Analyses

  • 文件:
    • knesset_sentences.json: 议会发言的句子分割
    • knesset_lemmas.json: 议会发言的词干提取
    • knesset_sentiment: 议会发言的情感预测

数据集语言

希伯来语

数据集标签

  • 希伯来语
  • 议会
  • 以色列议会(Knesset)
  • Twitter

数据集许可证

CC BY 4.0

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作