five

Tnaot/whisper-large-training-processed

收藏
Hugging Face2025-10-29 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/Tnaot/whisper-large-training-processed
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了五个字段:输入特征序列(浮点型)、标签(整型)、文本(字符串)、音频时长(双精度浮点型)和词汇计数(整型)。数据集分为训练集和评估集,分别含有43000和2000个示例。总下载大小约为10.51GB,总数据大小约为69.18GB。

The dataset includes five fields: input feature sequence (float32), labels (int64), text (string), audio duration (float64), and token count (int64). The dataset is divided into a training set and an evaluation set, containing 43,000 and 2,000 examples respectively. The total download size is approximately 10.51GB, and the total dataset size is approximately 69.18GB.
提供机构:
Tnaot
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作