five

ggfox00000/stt-fleurs-test

收藏
Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/ggfox00000/stt-fleurs-test
下载链接
链接失效反馈
官方服务:
资源简介:
FLEURS法语测试分割数据集是Google FLEURS项目的一部分,专门用于法语(fr_fr)的自动语音识别(ASR)任务。数据集包含676条语音样本,总时长为1.95小时,音频格式为16 kHz单声道WAV,嵌入在parquet文件中。每条样本包含音频文件、ID、原始转录(带标点)、标准化转录(小写)、字形分割、样本数量和性别信息。数据集的许可证为CC-BY-4.0,来源于Google的FLEURS上游项目。

The FLEURS French test split dataset is part of the Google FLEURS project, specifically designed for automatic speech recognition (ASR) tasks in French (fr_fr). The dataset contains 676 speech samples with a total duration of 1.95 hours, in 16 kHz mono WAV format embedded in parquet files. Each sample includes audio files, ID, raw transcription (with punctuation), normalized transcription (lowercase), grapheme segmentation, number of samples, and gender information. The dataset is licensed under CC-BY-4.0 and sourced from the upstream Google FLEURS project.
提供机构:
ggfox00000
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作