five

notlober/fleurs-en-tr

收藏
Hugging Face2024-07-06 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/notlober/fleurs-en-tr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频和转录文本信息,主要特征包括ID、英文音频(包含音频数组、路径和采样率)以及土耳其语转录文本。数据集分为一个训练集,包含1847个样本,总大小为2407469396字节,下载大小为1475747916字节。数据集的配置为默认配置,数据文件路径为data/train-*。

This dataset is primarily used for audio processing and language transcription tasks, including ID, English audio data with its sampling rate, and Turkish transcription. The dataset structure is clear, suitable for training models for audio recognition and transcription.
提供机构:
notlober
原始信息汇总

数据集概述

数据集信息

特征

  • id: 整数类型
  • en_audio: 结构化数据
    • array: 浮点数序列
    • path: 字符串类型
    • sampling_rate: 整数类型
  • tr_transcription: 字符串类型

数据分割

  • train:
    • 字节数: 2407469396
    • 样本数: 1847

数据集大小

  • 下载大小: 1475747916 字节
  • 数据集大小: 2407469396 字节

配置

  • default:
    • 数据文件路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作