Bingsu/KSS_Dataset

Name: Bingsu/KSS_Dataset
Creator: Bingsu
Published: 2022-07-02 00:10:10
License: 暂无描述

Hugging Face2022-07-02 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Bingsu/KSS_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

KSS数据集是一个韩语单说话者语音数据集，包含由专业女演员录制的音频文件及其对齐的文本。文本来源于作者的书籍，数据集包含12,853个音频文件，总时长超过12小时，采样率为44,100 KHZ。数据集的文件格式、来源、许可证、引用方式、联系信息等都有详细说明。数据集的结构包括音频文件路径、原始脚本、扩展脚本、分解脚本、音频时长和英文翻译等信息。

annotations_creators: - 专家生成 language_creators: - 专家生成 language: - 韩语（ko） license: - CC BY-NC-SA 4.0 multilinguality: - 单语言 pretty_name: 韩语单说话人语音数据集 size_categories: - 10K<n<100K source_datasets: - 原始数据集 task_categories: - 文本转语音（text-to-speech） task_ids: [] ## 数据集说明 - **主页:** [韩语单说话人语音数据集](https://www.kaggle.com/datasets/bryanpark/korean-single-speaker-speech-dataset) - **代码仓库:** [Kyubyong/kss](https://github.com/Kyubyong/kss) - **相关论文:** 无 - **排行榜:** 无 - **联系人:** 无 # 原作者说明 ### KSS数据集：韩语单说话人语音数据集本数据集专为韩语**文本转语音（text-to-speech）**任务设计，包含由专业女性配音演员录制的音频文件，以及从本人著作中提取的对齐文本。作为著作权持有人，经出版社授权，我将本数据集公开发布。据我所知，这是首个面向韩语的公开可用语音数据集。 ### 文件格式 `transcript.v.1.3.txt`中的每一行均以竖线`|`分隔为六个字段： - A. 音频文件路径 - B. 原始脚本 - C. 展开式脚本 - D. 分解式脚本 - E. 音频时长（秒） - F. 英文译文示例： 1/1_0470.wav|저는 보통 20분 정도 낮잠을 잡니다.|저는 보통 이십 분 정도 낮잠을 잡니다.|저는 보통 이십 분 정도 낮잠을 잡니다.|4.1|我通常会小睡20分钟左右。 ### 数据集规格 - 音频文件格式：WAV - 总时长：12小时以上 - 采样率：44100千赫兹 - 音频文件总数：12853条 - 数据来源 1. [朴奎炳，《500个基础韩语动词》，Tuttle Publishing，2015.](https://www.amazon.com/500-Basic-Korean-Verbs-Comprehensive/dp/0804846057/ref=sr_1_1?s=books&ie=UTF8&qid=1522911616&sr=1-1&keywords=kyubyong+park) 2. [朴奎炳，《500个基础韩语形容词（第2版）》，Youkrak，2015.](http://www.hanbooks.com/500bakoad.html) 3. [朴奎炳，《核心韩语词汇》，Tuttle Publishing，2015.](https://www.amazon.com/Essential-Korean-Vocabulary-Phrases-Fluently/dp/0804843252/ref=sr_1_3?s=books&ie=UTF8&qid=1522911806&sr=1-3&keywords=kyubyong+park) 4. [朴奎炳，《Tuttle学习者韩英词典》，Tuttle Publishing，2012.](https://www.amazon.com/Tuttle-Learners-Korean-English-Dictionary-Essential/dp/0804841500/ref=sr_1_8?s=books&ie=UTF8&qid=1522911806&sr=1-8&keywords=kyubyong+park) ### 许可协议本数据集采用CC BY-NC-SA 4.0协议。**严禁将本数据集用于任何商业用途**，除此之外可自由使用。 ### 引用格式若需引用本数据集，请参照以下格式： > 朴奎炳，KSS数据集：韩语单说话人语音数据集，https://kaggle.com/bryanpark/korean-single-speaker-speech-dataset，2018 ### 参考案例可查阅[此项目](https://github.com/Kyubyong/kss)了解使用本数据集的相关工程实现。 ### 联系方式可通过邮箱`kbpark.linguist@gmail.com`与作者联系。 2018年4月朴奎炳 ### 数据集概览本数据集包含12853条带转录文本的韩语音频文件。 ### 支持任务与排行榜文本转语音（text-to-speech），无公开排行榜。 ### 语言韩语 ## 数据集结构 ### 数据实例 python >>> from datasets import load_dataset >>> dataset = load_dataset("Bingsu/KSS_Dataset") >>> dataset["train"].features {'audio': Audio(sampling_rate=44100, mono=True, decode=True, id=None), 'original_script': Value(dtype='string', id=None), 'expanded_script': Value(dtype='string', id=None), 'decomposed_script': Value(dtype='string', id=None), 'duration': Value(dtype='float32', id=None), 'english_translation': Value(dtype='string', id=None)} python >>> dataset["train"][0] {'audio': {'path': None, 'array': array([ 0.00000000e+00, 3.05175781e-05, -4.57763672e-05, ..., 0.00000000e+00, -3.05175781e-05, -3.05175781e-05]), 'sampling_rate': 44100}, 'original_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.', 'expanded_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.', 'decomposed_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.', 'duration': 3.5, 'english_translation': 'He seemed to be pretending to be okay.'} ### 数据划分 | | 训练集 | |---------------|------:| | 样本总数 | 12853 |

提供机构：

Bingsu

原始信息汇总

数据集概述

名称: Korean Single Speaker Speech Dataset
语言: 韩语（ko）
许可证: CC-BY-NC-SA-4.0
多语言性: 单语种
大小: 10K<n<100K
源数据集: 原始数据
任务类别: 文本到语音（text-to-speech）

数据集详细描述

音频文件类型: wav
总运行时间: 超过12小时
采样率: 44,100 KHZ
音频文件数量: 12,853
文件格式: 每个transcript.v.1.3.txt文件中的行由|分隔成六个字段，包括音频文件路径、原始脚本、扩展脚本、分解脚本、音频时长和英文翻译。

数据集结构

数据实例: 每个实例包含音频数据及其相关的脚本和翻译信息。
数据分割: 数据集包含一个训练集，共有12,853个实例。

许可证信息

使用限制: 不可用于任何商业目的。

引用信息

引用格式: Kyubyong Park, KSS Dataset: Korean Single speaker Speech Dataset, https://kaggle.com/bryanpark/korean-single-speaker-speech-dataset, 2018

5,000+

优质数据集

54 个

任务类型

进入经典数据集