five

SinclairSchneider/Bundestagsreden_Paragraphs_with_likes

收藏
Hugging Face2024-06-20 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SinclairSchneider/Bundestagsreden_Paragraphs_with_likes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Bundestagsreden_Paragraphs_with_likes,主要包含德国联邦议院(Bundestag)的演讲段落数据。数据集中包含多个特征,如段落ID、会议周期、会议编号、演讲ID、日期、开始时间、结束时间、演讲者ID、演讲者头衔、演讲者姓名、演讲者所属党派或角色、段落文本、段落评论以及不同党派对这些段落的点赞情况。数据集分为训练集,包含132,319个样本,总大小为85,228,133字节。

The dataset named Bundestagsreden_Paragraphs_with_likes primarily contains paragraph data from speeches in the German Bundestag. The dataset includes multiple features such as Paragraph ID, legislative period, session number, speech ID, date, start time, end time, speaker ID, speaker title, speaker name, speaker party or role, paragraph text, paragraph comments, and likes from different political parties. The dataset is divided into a training set containing 132,319 samples with a total size of 85,228,133 bytes.
提供机构:
SinclairSchneider
原始信息汇总

数据集概述

数据集名称

Bundestagsreden_Paragraphs_with_likes

数据集特征

  • Paragraph_ID: 字符串类型
  • Wahlperiode: 整数类型
  • Sitzungsnummer: 整数类型
  • Rede_ID: 字符串类型
  • Datum: 整数类型
  • Beginn: 字符串类型
  • Schluss: 字符串类型
  • Redner_ID: 字符串类型
  • Redner_Titel: 字符串类型
  • Redner_Name: 字符串类型
  • Redner_Vorname: 字符串类型
  • Redner_Nachname: 字符串类型
  • Redner_Partei_oder_Rolle: 字符串类型
  • Paragraph_Text: 字符串类型
  • Paragraph_Kommentar: 字符串类型
  • liked_by_AfD: 整数类型
  • liked_by_BUENDNIS_90_DIE_GRUENEN: 整数类型
  • liked_by_CDU_CSU: 整数类型
  • liked_by_DIE_LINKE: 整数类型
  • liked_by_FDP: 整数类型
  • liked_by_SPD: 整数类型
  • index_level_0: 整数类型

数据集分割

  • train: 包含132319个样本,占用85228133字节

数据集大小

  • 下载大小: 34024815字节
  • 数据集大小: 85228133字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作