espnet/ace-kising-segments
收藏Hugging Face2024-09-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/espnet/ace-kising-segments
下载链接
链接失效反馈官方服务:
资源简介:
ACE-KiSing数据集是一个多语言数据集,包含中文和英文,主要用于文本到音频、音频到音频和自动语音识别任务。数据集包含音频、片段ID、转录、歌手、标签、节奏、音符MIDI、音符音素、音符歌词、音符开始时间、音符结束时间、音素、音素开始时间和音素结束时间等特征。数据集分为训练集、验证集和测试集,分别包含19432、50和3543个示例。数据集的总下载大小为10401491812字节,总数据集大小为10482429088.039字节。
The ACE-KiSing dataset is a multilingual (Chinese and English) and multitask dataset, featuring audio files, transcription text, singer information, labels, tempo, note MIDI values, note pronunciations, note lyrics, note start and end times, phonemes, and their start and end times. The dataset is divided into train, validation, and test sets, suitable for text-to-audio, audio-to-audio, and automatic speech recognition tasks.
提供机构:
espnet
原始信息汇总
数据集概述
基本信息
- 语言: 中文, 英文
- 许可: CC BY-NC 4.0
- 多语言性: 多语言
- 数据集大小: 10K<n<100K
- 数据来源: 原始数据
- 任务类别:
- 文本到音频
- 音频到音频
- 自动语音识别
- 数据集名称: ACE-KiSing
数据集结构
特征
- 音频: 音频数据
- segment_id: 字符串
- transcription: 字符串
- singer: 字符串
- label: 字符串
- tempo: 整数
- note_midi: 浮点数序列
- note_phns: 字符串序列
- note_lyrics: 字符串序列
- note_start_times: 浮点数序列
- note_end_times: 浮点数序列
- phn: 字符串序列
- phn_start_time: 浮点数序列
- phn_end_time: 浮点数序列
数据分割
- 训练集:
- 样本数: 19432
- 字节数: 8843208465.296
- 验证集:
- 样本数: 50
- 字节数: 51661360.0
- 测试集:
- 样本数: 3543
- 字节数: 1587559262.743
数据文件
- 默认配置:
- 训练集: data/train-*
- 验证集: data/validation-*
- 测试集: data/test-*
数据集大小
- 下载大小: 10401491812
- 数据集大小: 10482429088.039
引用信息
bibtex @misc{shi2024singingvoicedatascalingup, title={Singing Voice Data Scaling-up: An Introduction to ACE-Opencpop and ACE-KiSing}, author={Jiatong Shi and Yueqian Lin and Xinyi Bai and Keyi Zhang and Yuning Wu and Yuxun Tang and Yifeng Yu and Qin Jin and Shinji Watanabe}, year={2024}, eprint={2401.17619}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2401.17619}, }



