five

wjustus01/dana-voice-dataset3

收藏
Hugging Face2025-04-01 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/wjustus01/dana-voice-dataset3
下载链接
链接失效反馈
官方服务:
资源简介:
dana-voice-dataset3是一个包含110个音频样本的TTS数据集,专为Unsloth微调优化。音频采样率为24000 Hz,平均音频时长为10.04秒。所有转录文本使用gpt2 tokenizer,平均token数量为43.1,最长不超过1852个token。所有样本均使用名为Dana的声音。数据集已预过滤,确保转录文本长度适合,避免在微调时因填充长度超出块大小而导致错误。数据集适用于Orpheus等TTS模型,使用Unsloth微调时需确保max_seq_length参数设置为小于等于1900。

dana-voice-dataset3 is a TTS dataset containing 110 audio samples optimized for Unsloth fine-tuning. The audio sample rate is 24000 Hz, with an average audio duration of 10.04 seconds. All transcripts use the gpt2 tokenizer, with an average of 43.1 tokens, and no transcript exceeding 1852 tokens. All samples utilize the voice named Dana. The dataset has been pre-filtered to ensure suitable transcript lengths, preventing AssertionError: Padding is larger than block size during fine-tuning. The dataset is formatted for use with TTS models like Orpheus, and when using Unsloth fine-tuning, ensure the max_seq_length parameter is set to less than or equal to 1900.
提供机构:
wjustus01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作