Lingalingeswaran/common_voice_tamil_english-labeled-Data-filtered-v3

Name: Lingalingeswaran/common_voice_tamil_english-labeled-Data-filtered-v3
Creator: Lingalingeswaran
Published: 2024-12-20 17:06:41
License: 暂无描述

Hugging Face2024-12-20 更新2024-12-21 收录

下载链接：

https://hf-mirror.com/datasets/Lingalingeswaran/common_voice_tamil_english-labeled-Data-filtered-v3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含泰米尔语和英语两种语言的音频和文本数据，每种语言有2000个样本。数据集的特征包括客户端ID、文件路径、音频数据、句子文本、点赞数、点踩数、年龄、性别、口音、地区和片段信息。数据集的总下载大小为150600571字节，总数据集大小为170455344.91841796字节。

The dataset contains speech data in Tamil and English. Each sample includes client ID, audio file path, audio data (sampling rate of 48000), sentence text, up votes, down votes, age, gender, accent, locale, and segment information. The dataset is divided into two parts: Tamil and English, each containing 2000 samples. The total download size of the dataset is 150600571 bytes, and the total dataset size is 170455344.91841796 bytes.

提供机构：

Lingalingeswaran

5,000+

优质数据集

54 个

任务类型

进入经典数据集