five

Bingsu/KSS_Dataset

收藏
Hugging Face2022-07-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Bingsu/KSS_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
KSS数据集是一个韩语单说话者语音数据集,包含由专业女演员录制的音频文件及其对齐的文本。文本来源于作者的书籍,数据集包含12,853个音频文件,总时长超过12小时,采样率为44,100 KHZ。数据集的文件格式、来源、许可证、引用方式、联系信息等都有详细说明。数据集的结构包括音频文件路径、原始脚本、扩展脚本、分解脚本、音频时长和英文翻译等信息。

annotations_creators: - 专家生成 language_creators: - 专家生成 language: - 韩语(ko) license: - CC BY-NC-SA 4.0 multilinguality: - 单语言 pretty_name: 韩语单说话人语音数据集 size_categories: - 10K<n<100K source_datasets: - 原始数据集 task_categories: - 文本转语音(text-to-speech) task_ids: [] ## 数据集说明 - **主页:** [韩语单说话人语音数据集](https://www.kaggle.com/datasets/bryanpark/korean-single-speaker-speech-dataset) - **代码仓库:** [Kyubyong/kss](https://github.com/Kyubyong/kss) - **相关论文:** 无 - **排行榜:** 无 - **联系人:** 无 # 原作者说明 ### KSS数据集:韩语单说话人语音数据集 本数据集专为韩语**文本转语音(text-to-speech)**任务设计,包含由专业女性配音演员录制的音频文件,以及从本人著作中提取的对齐文本。作为著作权持有人,经出版社授权,我将本数据集公开发布。据我所知,这是首个面向韩语的公开可用语音数据集。 ### 文件格式 `transcript.v.1.3.txt`中的每一行均以竖线`|`分隔为六个字段: - A. 音频文件路径 - B. 原始脚本 - C. 展开式脚本 - D. 分解式脚本 - E. 音频时长(秒) - F. 英文译文 示例: 1/1_0470.wav|저는 보통 20분 정도 낮잠을 잡니다.|저는 보통 이십 분 정도 낮잠을 잡니다.|저는 보통 이십 분 정도 낮잠을 잡니다.|4.1|我通常会小睡20分钟左右。 ### 数据集规格 - 音频文件格式:WAV - 总时长:12小时以上 - 采样率:44100千赫兹 - 音频文件总数:12853条 - 数据来源 1. [朴奎炳,《500个基础韩语动词》,Tuttle Publishing,2015.](https://www.amazon.com/500-Basic-Korean-Verbs-Comprehensive/dp/0804846057/ref=sr_1_1?s=books&ie=UTF8&qid=1522911616&sr=1-1&keywords=kyubyong+park) 2. [朴奎炳,《500个基础韩语形容词(第2版)》,Youkrak,2015.](http://www.hanbooks.com/500bakoad.html) 3. [朴奎炳,《核心韩语词汇》,Tuttle Publishing,2015.](https://www.amazon.com/Essential-Korean-Vocabulary-Phrases-Fluently/dp/0804843252/ref=sr_1_3?s=books&ie=UTF8&qid=1522911806&sr=1-3&keywords=kyubyong+park) 4. [朴奎炳,《Tuttle学习者韩英词典》,Tuttle Publishing,2012.](https://www.amazon.com/Tuttle-Learners-Korean-English-Dictionary-Essential/dp/0804841500/ref=sr_1_8?s=books&ie=UTF8&qid=1522911806&sr=1-8&keywords=kyubyong+park) ### 许可协议 本数据集采用CC BY-NC-SA 4.0协议。**严禁将本数据集用于任何商业用途**,除此之外可自由使用。 ### 引用格式 若需引用本数据集,请参照以下格式: > 朴奎炳,KSS数据集:韩语单说话人语音数据集,https://kaggle.com/bryanpark/korean-single-speaker-speech-dataset,2018 ### 参考案例 可查阅[此项目](https://github.com/Kyubyong/kss)了解使用本数据集的相关工程实现。 ### 联系方式 可通过邮箱`kbpark.linguist@gmail.com`与作者联系。 2018年4月 朴奎炳 ### 数据集概览 本数据集包含12853条带转录文本的韩语音频文件。 ### 支持任务与排行榜 文本转语音(text-to-speech),无公开排行榜。 ### 语言 韩语 ## 数据集结构 ### 数据实例 python >>> from datasets import load_dataset >>> dataset = load_dataset("Bingsu/KSS_Dataset") >>> dataset["train"].features {'audio': Audio(sampling_rate=44100, mono=True, decode=True, id=None), 'original_script': Value(dtype='string', id=None), 'expanded_script': Value(dtype='string', id=None), 'decomposed_script': Value(dtype='string', id=None), 'duration': Value(dtype='float32', id=None), 'english_translation': Value(dtype='string', id=None)} python >>> dataset["train"][0] {'audio': {'path': None, 'array': array([ 0.00000000e+00, 3.05175781e-05, -4.57763672e-05, ..., 0.00000000e+00, -3.05175781e-05, -3.05175781e-05]), 'sampling_rate': 44100}, 'original_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.', 'expanded_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.', 'decomposed_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.', 'duration': 3.5, 'english_translation': 'He seemed to be pretending to be okay.'} ### 数据划分 | | 训练集 | |---------------|------:| | 样本总数 | 12853 |
提供机构:
Bingsu
原始信息汇总

数据集概述

  • 名称: Korean Single Speaker Speech Dataset
  • 语言: 韩语(ko)
  • 许可证: CC-BY-NC-SA-4.0
  • 多语言性: 单语种
  • 大小: 10K<n<100K
  • 源数据集: 原始数据
  • 任务类别: 文本到语音(text-to-speech)

数据集详细描述

  • 音频文件类型: wav
  • 总运行时间: 超过12小时
  • 采样率: 44,100 KHZ
  • 音频文件数量: 12,853
  • 文件格式: 每个transcript.v.1.3.txt文件中的行由|分隔成六个字段,包括音频文件路径、原始脚本、扩展脚本、分解脚本、音频时长和英文翻译。

数据集结构

  • 数据实例: 每个实例包含音频数据及其相关的脚本和翻译信息。
  • 数据分割: 数据集包含一个训练集,共有12,853个实例。

许可证信息

  • 使用限制: 不可用于任何商业目的。

引用信息

  • 引用格式: Kyubyong Park, KSS Dataset: Korean Single speaker Speech Dataset, https://kaggle.com/bryanpark/korean-single-speaker-speech-dataset, 2018
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作