Athirham/french-tts-ft1
收藏Hugging Face2026-03-18 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Athirham/french-tts-ft1
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- fr
license: cc-by-nc-4.0
task_categories:
- text-to-speech
tags:
- french
- tts
- moshi
- audio
---
# French TTS — FT1 Dataset
Dataset pour le **pré-entraînement (FT1)** dans un pipeline de double fine-tuning TTS français.
## Sources
| Source | Licence | Style |
|---|---|---|
| **Emilia-FR** | CC-BY-NC 4.0 | Spontané, varié (podcasts, débats) |
| **Blizzard NEB** | CC-BY 4.0 | Audiobook studio, haute qualité |
## Stats
- Train : 100842 exemples (156.8h)
- Validation : 2058 exemples (3.2h)
- Sample rate : 24000 Hz
- Filtres : durée [1.0s–30.0s], SNR ≥ 20.0 dB (Blizzard uniquement)
## Usage
```python
from datasets import load_dataset
ds = load_dataset("Athirham/french-tts-ft1", split="train", streaming=True)
```
## Pipeline double fine-tuning
- **FT1** (ce dataset) → sémantique française, phonologie, diversité prosodique
- **FT2** (SIWIS ~10h) → accent naturel, timbre propre, pas de son robotique
提供机构:
Athirham



