ymoslem/FLEURS-GA-EN
收藏Hugging Face2024-06-24 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/ymoslem/FLEURS-GA-EN
下载链接
链接失效反馈官方服务:
资源简介:
这是FLEURS数据集中爱尔兰语到英语的部分。FLEURS是FLoRes机器翻译基准的语音版本。爱尔兰语部分包含3991条语音数据,对应约16小时45分钟的音频。数据集的结构包括id、audio、text_ga和text_en四个特征,主要用于自动语音识别、文本到语音转换和翻译任务。数据集的许可证为cc-by-4.0。
这是FLEURS数据集中爱尔兰语到英语的部分。FLEURS是FLoRes机器翻译基准的语音版本。爱尔兰语部分包含3991条语音数据,对应约16小时45分钟的音频。数据集的结构包括id、audio、text_ga和text_en四个特征,主要用于自动语音识别、文本到语音转换和翻译任务。数据集的许可证为cc-by-4.0。
提供机构:
ymoslem
原始信息汇总
数据集概述
数据集特征
- id: 整数类型 (int32)
- audio: 音频类型,采样率为16000
- text_ga: 字符串类型
- text_en: 字符串类型
数据集分割
- 训练集 (train):
- 示例数量: 3991
- 数据大小: 3870768224.282949 字节
数据集大小与下载大小
- 下载大小: 3801639185 字节
- 数据集大小: 3870768224.282949 字节
配置信息
- 配置名称: default
- 数据文件路径:
data/train-*



