guymorlan/IsraParlTweet
收藏Hugging Face2024-05-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/guymorlan/IsraParlTweet
下载链接
链接失效反馈官方服务:
资源简介:
IsraParlTweet数据集是一个包含以色列议会(Knesset)1992年至2023年的希伯来语议会讨论和2008年至2023年议会成员的Twitter帖子的链接语料库,总计2.945亿个希伯来语词汇。数据集分为四个主要部分:议会会议、Twitter帖子、办公室会议和语言分析。议会会议部分包含议员的发言记录,Twitter帖子部分包含议员的推文,办公室会议部分包含议员的任职信息,语言分析部分包含对议会发言的句子分割、词干提取和情感分析。数据集还包含详细的元数据和语言注释,适用于多种定量和定性分析,为以色列政治话语提供了宝贵的见解。
IsraParlTweet数据集是一个包含以色列议会(Knesset)1992年至2023年的希伯来语议会讨论和2008年至2023年议会成员的Twitter帖子的链接语料库,总计2.945亿个希伯来语词汇。数据集分为四个主要部分:议会会议、Twitter帖子、办公室会议和语言分析。议会会议部分包含议员的发言记录,Twitter帖子部分包含议员的推文,办公室会议部分包含议员的任职信息,语言分析部分包含对议会发言的句子分割、词干提取和情感分析。数据集还包含详细的元数据和语言注释,适用于多种定量和定性分析,为以色列政治话语提供了宝贵的见解。
提供机构:
guymorlan
原始信息汇总
数据集概述
数据集名称
IsraParlTweet: The Israeli Parliamentary and Twitter Resource
数据集内容
该数据集包含以下四个主要部分:
1. Knesset Sessions
- 文件名: knesset_speeches.csv
- 内容: 包含以色列议会(Knesset)成员在议会中的发言,共计约4.5M个独立发言。
- 字段:
- text: 发言文本
- uuid: 唯一文本标识符
- knesset: 议会任期
- session_number: 当前议会任期内的会议编号
- date: 会议日期
- person_id: 发言人数字标识符
- canonical_name: 发言人的标准姓名
- name: 从议会记录中提取的发言人姓名
- chair: 是否为会议主席
- topic: 讨论主题或议程项目
- topic_extra: 主题的额外信息
- qa: 是否为问答环节
- query: 口头回答的书面问题
- only_read: 是否为阅读而非口头回答的问答环节
2. Twitter Posts
- 访问方式: 需联系作者获取
- 内容: 包含以色列议会成员在Twitter上的帖子,涵盖2008年至2023年。
- 字段:
- text: 推文文本
- uuid: 唯一文本标识符
- tweet_id: Twitter的唯一推文标识符
- date: 推文日期
- knesset: 与推文日期对应的议会任期
- person_id: 推文发布者的数字标识符
- user_id: Twitter用户ID
- username: Twitter用户名
- name: 发布者的标准姓名
- likes: 收集时获得的点赞数
- retweets: 收集时获得的转发数
- replies: 收集时获得的回复数
- quotes: 收集时获得的引用数
3. Office Sessions
- 文件名: metadata.csv
- 内容: 描述议会成员办公室会议的元数据。
- 字段:
- start_date: 办公室会议开始日期
- end_date: 办公室会议结束日期
- knesset: 相关议会任期
- person_id: 唯一个人ID
- first_name: 议会成员的名字
- surname: 议会成员的姓氏
- gender: 议会成员的性别
- faction: 议会成员服务的派系名称
- faction_id: 派系的唯一标识符
- party_name: 议会成员服务的统一党派名称
- dob: 议会成员的出生日期
- cob: 议会成员的出生国家
- yod: 议会成员的死亡年份
- yoi: 议会成员移民至以色列的年份
- city: 议会成员的居住城市
- languages: 议会成员的口语语言
4. Linguistic Analyses
- 文件:
- knesset_sentences.json: 议会发言的句子分割
- knesset_lemmas.json: 议会发言的词干提取
- knesset_sentiment: 议会发言的情感预测
数据集语言
希伯来语
数据集标签
- 希伯来语
- 议会
- 以色列议会(Knesset)
数据集许可证
CC BY 4.0



