TristanBehrens/HeilbronnPodcastsWindowed
收藏Hugging Face2024-03-09 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/TristanBehrens/HeilbronnPodcastsWindowed
下载链接
链接失效反馈官方服务:
资源简介:
Heilbronn播客转录数据集是一个德语数据集,包含了来自Heilbronn的两个播客的转录文本。数据集由Robert Mucha提供,包含Originalteile Podcast和Schwarmstadt Podcast的剧集。数据集的统计信息基于tokenize估计策略,包括窗口长度、跳跃长度、最小长度、平均长度、标准差长度、最大长度和行数。
Heilbronn播客转录数据集是一个德语数据集,包含了来自Heilbronn的两个播客的转录文本。数据集由Robert Mucha提供,包含Originalteile Podcast和Schwarmstadt Podcast的剧集。数据集的统计信息基于tokenize估计策略,包括窗口长度、跳跃长度、最小长度、平均长度、标准差长度、最大长度和行数。
提供机构:
TristanBehrens
原始信息汇总
Heilbronn Podcast Transcripts Dataset
概述
Heilbronn Podcast Transcripts Dataset 是一个德语的播客转录数据集,由 Robert Mucha 提供。
内容
数据集包含以下播客的转录内容:
- Originalteile Podcast episodes
- Schwarmstadt Podcast episodes
统计信息
数据集包含 78 个转录文件,统计信息基于 tokenize 估计策略。
统计参数
- 窗口长度 (Window length): 30
- 跳跃长度 (Hop length): 10
- 最小长度 (Min length): 665.00
- 平均长度 (Mean length): 3080.09
- 标准差长度 (STD length): 1708.43
- 最大长度 (Max length): 12596.00
- 行数 (Lines): 1485



