tillschwoerer/tagesschau
收藏Hugging Face2022-12-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tillschwoerer/tagesschau
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- found
language:
- de
language_creators:
- found
license: []
multilinguality:
- monolingual
pretty_name: tagesschau
size_categories:
- 1K<n<10K
source_datasets: []
tags:
- newspapers
- germany
- '2022'
task_categories:
- text-classification
task_ids:
- topic-classification
dataset_info:
features:
- name: text
dtype: string
- name: label
dtype:
class_label:
names:
'0': amerika
'1': asien
'2': finanzen
'3': innenpolitik
'4': sportschau
'5': unternehmen
'6': verbraucher
splits:
- name: train
num_bytes: 4400114
num_examples: 1200
- name: validation
num_bytes: 555716
num_examples: 150
- name: test
num_bytes: 555716
num_examples: 150
download_size: 3412287
dataset_size: 5511546
---
# Dataset Card for "tagesschau"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
tillschwoerer
原始信息汇总
数据集概述
基本信息
- 名称: tagesschau
- 语言: 德语(de)
- 多语言性: 单语种
- 数据集大小: 1K<n<10K
- 许可证: 未指定
- 标签: 报纸、德国、2022
- 任务类别: 文本分类
- 任务ID: 主题分类
数据集特征
- 文本字段:
- 名称: text
- 数据类型: 字符串
- 标签字段:
- 名称: label
- 数据类型: 类别标签
- 类别名称:
- 0: amerika
- 1: asien
- 2: finanzen
- 3: innenpolitik
- 4: sportschau
- 5: unternehmen
- 6: verbraucher
数据集划分
- 训练集:
- 示例数量: 1200
- 字节数: 4400114
- 验证集:
- 示例数量: 150
- 字节数: 555716
- 测试集:
- 示例数量: 150
- 字节数: 555716
数据集大小
- 下载大小: 3412287字节
- 数据集总大小: 5511546字节



