five

espnet/ace-kising-segments

收藏
Hugging Face2024-09-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/espnet/ace-kising-segments
下载链接
链接失效反馈
官方服务:
资源简介:
ACE-KiSing数据集是一个多语言数据集,包含中文和英文,主要用于文本到音频、音频到音频和自动语音识别任务。数据集包含音频、片段ID、转录、歌手、标签、节奏、音符MIDI、音符音素、音符歌词、音符开始时间、音符结束时间、音素、音素开始时间和音素结束时间等特征。数据集分为训练集、验证集和测试集,分别包含19432、50和3543个示例。数据集的总下载大小为10401491812字节,总数据集大小为10482429088.039字节。

The ACE-KiSing dataset is a multilingual (Chinese and English) and multitask dataset, featuring audio files, transcription text, singer information, labels, tempo, note MIDI values, note pronunciations, note lyrics, note start and end times, phonemes, and their start and end times. The dataset is divided into train, validation, and test sets, suitable for text-to-audio, audio-to-audio, and automatic speech recognition tasks.
提供机构:
espnet
原始信息汇总

数据集概述

基本信息

  • 语言: 中文, 英文
  • 许可: CC BY-NC 4.0
  • 多语言性: 多语言
  • 数据集大小: 10K<n<100K
  • 数据来源: 原始数据
  • 任务类别:
    • 文本到音频
    • 音频到音频
    • 自动语音识别
  • 数据集名称: ACE-KiSing

数据集结构

特征

  • 音频: 音频数据
  • segment_id: 字符串
  • transcription: 字符串
  • singer: 字符串
  • label: 字符串
  • tempo: 整数
  • note_midi: 浮点数序列
  • note_phns: 字符串序列
  • note_lyrics: 字符串序列
  • note_start_times: 浮点数序列
  • note_end_times: 浮点数序列
  • phn: 字符串序列
  • phn_start_time: 浮点数序列
  • phn_end_time: 浮点数序列

数据分割

  • 训练集:
    • 样本数: 19432
    • 字节数: 8843208465.296
  • 验证集:
    • 样本数: 50
    • 字节数: 51661360.0
  • 测试集:
    • 样本数: 3543
    • 字节数: 1587559262.743

数据文件

  • 默认配置:
    • 训练集: data/train-*
    • 验证集: data/validation-*
    • 测试集: data/test-*

数据集大小

  • 下载大小: 10401491812
  • 数据集大小: 10482429088.039

引用信息

bibtex @misc{shi2024singingvoicedatascalingup, title={Singing Voice Data Scaling-up: An Introduction to ACE-Opencpop and ACE-KiSing}, author={Jiatong Shi and Yueqian Lin and Xinyi Bai and Keyi Zhang and Yuning Wu and Yuxun Tang and Yifeng Yu and Qin Jin and Shinji Watanabe}, year={2024}, eprint={2401.17619}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2401.17619}, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作