yashtiwari/fleurs-hi-en-ST
收藏Hugging Face2023-10-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/yashtiwari/fleurs-hi-en-ST
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于印地语到英语的语音到文本翻译的数据集,使用了fleurs和flores数据集来构建。数据集包含id、hindi、english和audio特征,其中audio是一个结构体,包含array、path和sampling_rate。数据集的分割只有train,包含876个样本,总大小为1286250983字节。
这是一个用于印地语到英语的语音到文本翻译的数据集,使用了fleurs和flores数据集来构建。数据集包含id、hindi、english和audio特征,其中audio是一个结构体,包含array、path和sampling_rate。数据集的分割只有train,包含876个样本,总大小为1286250983字节。
提供机构:
yashtiwari
原始信息汇总
数据集概述
数据集信息
-
特征:
id: 数据类型为int64hindi: 数据类型为stringenglish: 数据类型为stringaudio: 结构化数据,包含以下字段:array: 序列类型为float64path: 数据类型为stringsampling_rate: 数据类型为int64
-
分割:
train: 字节数为1286250983,样本数为876
-
下载大小:
824653765字节 -
数据集大小:
1286250983字节
配置
- 默认配置:
data_files:split:trainpath:data/train-*
数据集描述
- 该数据集用于印地语到英语的语音转文本翻译。构建该数据集使用的原始数据为
fleurs和flores。



