SinclairSchneider/taz_de
收藏Hugging Face2024-03-30 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/SinclairSchneider/taz_de
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含德语新闻文章,涉及政治等主题。数据集的特征包括标题、内容、作者、描述、关键词、观点、发布时间、修改时间和索引级别。数据集的分割为训练集,包含724,878个样本和3,534,473,312字节的数据。数据集的语言为德语,标签包括新闻、Nachrichten、德国新闻和政治。大小类别为100K<n<1M。
This dataset contains German news articles covering topics such as politics. The features of the dataset include title, content, author, description, keywords, viewpoints, release time, modification time and index level. The dataset is split into a training set, which contains 724,878 samples and 3,534,473,312 bytes of data. The language of the dataset is German, and its labels include news, Nachrichten, German news and politics. The size category is 100K < n < 1M.
提供机构:
SinclairSchneider
原始信息汇总
数据集概述
特征信息
- 名称: title
- 数据类型: string
- 名称: content
- 数据类型: string
- 名称: author
- 数据类型: string
- 名称: description
- 数据类型: string
- 名称: keywords
- 数据类型: sequence of string
- 名称: opinion
- 数据类型: bool
- 名称: date_published_time_at
- 数据类型: timestamp[ns, tz=+02:00]
- 名称: date_modified_at
- 数据类型: timestamp[ns, tz=+02:00]
- 名称: index_level_0
- 数据类型: int64
数据分割
- 名称: train
- 字节数: 3534473312
- 样本数: 724878
数据大小
- 下载大小: 2227143894
- 数据集大小: 3534473312
语言
- de
标签
- news
- Nachrichten
- German news
- politics
大小分类
- 100K<n<1M



