SinclairSchneider/Bundestagsreden_Paragraphs_with_likes
收藏Hugging Face2024-06-20 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SinclairSchneider/Bundestagsreden_Paragraphs_with_likes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Bundestagsreden_Paragraphs_with_likes,主要包含德国联邦议院(Bundestag)的演讲段落数据。数据集中包含多个特征,如段落ID、会议周期、会议编号、演讲ID、日期、开始时间、结束时间、演讲者ID、演讲者头衔、演讲者姓名、演讲者所属党派或角色、段落文本、段落评论以及不同党派对这些段落的点赞情况。数据集分为训练集,包含132,319个样本,总大小为85,228,133字节。
The dataset named Bundestagsreden_Paragraphs_with_likes primarily contains paragraph data from speeches in the German Bundestag. The dataset includes multiple features such as Paragraph ID, legislative period, session number, speech ID, date, start time, end time, speaker ID, speaker title, speaker name, speaker party or role, paragraph text, paragraph comments, and likes from different political parties. The dataset is divided into a training set containing 132,319 samples with a total size of 85,228,133 bytes.
提供机构:
SinclairSchneider
原始信息汇总
数据集概述
数据集名称
Bundestagsreden_Paragraphs_with_likes
数据集特征
- Paragraph_ID: 字符串类型
- Wahlperiode: 整数类型
- Sitzungsnummer: 整数类型
- Rede_ID: 字符串类型
- Datum: 整数类型
- Beginn: 字符串类型
- Schluss: 字符串类型
- Redner_ID: 字符串类型
- Redner_Titel: 字符串类型
- Redner_Name: 字符串类型
- Redner_Vorname: 字符串类型
- Redner_Nachname: 字符串类型
- Redner_Partei_oder_Rolle: 字符串类型
- Paragraph_Text: 字符串类型
- Paragraph_Kommentar: 字符串类型
- liked_by_AfD: 整数类型
- liked_by_BUENDNIS_90_DIE_GRUENEN: 整数类型
- liked_by_CDU_CSU: 整数类型
- liked_by_DIE_LINKE: 整数类型
- liked_by_FDP: 整数类型
- liked_by_SPD: 整数类型
- index_level_0: 整数类型
数据集分割
- train: 包含132319个样本,占用85228133字节
数据集大小
- 下载大小: 34024815字节
- 数据集大小: 85228133字节



