five

shangeth/vctk-mimi-codes

收藏
Hugging Face2026-04-30 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/shangeth/vctk-mimi-codes
下载链接
链接失效反馈
官方服务:
资源简介:
VCTK Mimi Codes (mic1)是基于VCTK Corpus预提取的Kyutai Mimi tokens数据集,包含109位讲者,覆盖11种英国、苏格兰和美国口音,总计约44小时的朗读语音。仅包含mic1录音,排除了mic2的重复录音。数据集的结构包括id、text、speaker_id、accent、codes等字段。提取细节包括数据来源、编解码器、重采样和过滤条件。

VCTK Mimi Codes (mic1) are pre-extracted Kyutai Mimi tokens for the VCTK Corpus — 109 speakers across 11 British, Scottish, and American accents. ~44h of read speech. Only mic1 recordings are included. Mic2 duplicates are excluded. The dataset schema includes id, text, speaker_id, accent, codes, etc. Extraction details cover the source, codec, resampling, and filtering conditions.
提供机构:
shangeth
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作