Rashmi21/vtdataset
收藏Hugging Face2024-04-23 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Rashmi21/vtdataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于翻译任务,包含音频、标签和转录文本三个特征。数据集分为训练集和测试集,训练集包含155个样本,测试集包含52个样本。数据集的总下载大小为93996207字节,总数据集大小为97678414字节。
This dataset contains audio data in English, suitable for translation tasks. It is divided into training and test sets, containing 155 and 52 samples respectively. Each sample includes audio, label, and transcription text. The dataset is licensed under Apache 2.0.
提供机构:
Rashmi21
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可证: Apache 2.0
- 数据集大小: 97,678,414.0 字节
- 下载大小: 93,996,207 字节
数据集特征
- 音频: 包含音频数据
- 标签: 包含分类标签,标签名称为 "test" 和 "train"
- 转录文本: 包含字符串类型的转录文本
数据集分割
- 训练集:
- 样本数量: 155
- 字节数: 73,331,352.0
- 测试集:
- 样本数量: 52
- 字节数: 24,347,062.0
配置
- 默认配置:
- 训练数据路径:
data/train-* - 测试数据路径:
data/test-*
- 训练数据路径:



