five

Rashmi21/vtdataset

收藏
Hugging Face2024-04-23 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Rashmi21/vtdataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于翻译任务,包含音频、标签和转录文本三个特征。数据集分为训练集和测试集,训练集包含155个样本,测试集包含52个样本。数据集的总下载大小为93996207字节,总数据集大小为97678414字节。

This dataset contains audio data in English, suitable for translation tasks. It is divided into training and test sets, containing 155 and 52 samples respectively. Each sample includes audio, label, and transcription text. The dataset is licensed under Apache 2.0.
提供机构:
Rashmi21
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可证: Apache 2.0
  • 数据集大小: 97,678,414.0 字节
  • 下载大小: 93,996,207 字节

数据集特征

  • 音频: 包含音频数据
  • 标签: 包含分类标签,标签名称为 "test" 和 "train"
  • 转录文本: 包含字符串类型的转录文本

数据集分割

  • 训练集:
    • 样本数量: 155
    • 字节数: 73,331,352.0
  • 测试集:
    • 样本数量: 52
    • 字节数: 24,347,062.0

配置

  • 默认配置:
    • 训练数据路径: data/train-*
    • 测试数据路径: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作