five

taras-sereda/uk-pods

收藏
Hugging Face2024-06-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/taras-sereda/uk-pods
下载链接
链接失效反馈
官方服务:
资源简介:
UK-PODS是一个包含乌克兰语播客语音的数据集,主要用于自动语音识别任务。数据集包含34231个wav文件,总时长为51.066小时,每个文件的时长在1.020秒到19.999秒之间,平均时长为5.370秒,中位时长为4.640秒。数据集的准备步骤包括克隆数据集仓库并解压音频文件,使用NeMo工具包进行训练和推理。数据集遵循cc-by-nc-4.0许可。

UK-PODS is a dataset containing Ukrainian podcast speech data, primarily used for automatic speech recognition tasks. The dataset includes 34,231 wav files with a total duration of 51.066 hours. The duration of each file ranges from 1.020 seconds to 19.999 seconds, with an average duration of 5.370 seconds and a median duration of 4.640 seconds. The preparation steps for the dataset involve cloning the dataset repository and extracting the audio files, and using the NeMo toolkit for training and inference. The dataset is licensed under cc-by-nc-4.0.
提供机构:
taras-sereda
原始信息汇总

数据集概述

基本信息

  • 数据集名称: uk-pods
  • 数据集类型: 乌克兰播客语音数据集

数据统计

  • 文件数量: 34231个wav文件
  • 总时长: 51.066小时
  • 最小时长: 1.020秒
  • 最大时长: 19.999秒
  • 平均时长: 5.370秒
  • 中位数时长: 4.640秒
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作