five

TristanBehrens/HeilbronnPodcastsWindowed

收藏
Hugging Face2024-03-09 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/TristanBehrens/HeilbronnPodcastsWindowed
下载链接
链接失效反馈
官方服务:
资源简介:
Heilbronn播客转录数据集是一个德语数据集,包含了来自Heilbronn的两个播客的转录文本。数据集由Robert Mucha提供,包含Originalteile Podcast和Schwarmstadt Podcast的剧集。数据集的统计信息基于tokenize估计策略,包括窗口长度、跳跃长度、最小长度、平均长度、标准差长度、最大长度和行数。

Heilbronn播客转录数据集是一个德语数据集,包含了来自Heilbronn的两个播客的转录文本。数据集由Robert Mucha提供,包含Originalteile Podcast和Schwarmstadt Podcast的剧集。数据集的统计信息基于tokenize估计策略,包括窗口长度、跳跃长度、最小长度、平均长度、标准差长度、最大长度和行数。
提供机构:
TristanBehrens
原始信息汇总

Heilbronn Podcast Transcripts Dataset

概述

Heilbronn Podcast Transcripts Dataset 是一个德语的播客转录数据集,由 Robert Mucha 提供。

内容

数据集包含以下播客的转录内容:

  • Originalteile Podcast episodes
  • Schwarmstadt Podcast episodes

统计信息

数据集包含 78 个转录文件,统计信息基于 tokenize 估计策略。

统计参数

  • 窗口长度 (Window length): 30
  • 跳跃长度 (Hop length): 10
  • 最小长度 (Min length): 665.00
  • 平均长度 (Mean length): 3080.09
  • 标准差长度 (STD length): 1708.43
  • 最大长度 (Max length): 12596.00
  • 行数 (Lines): 1485
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作