Bingsu/KSS_Dataset
收藏Hugging Face2022-07-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Bingsu/KSS_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
KSS数据集是一个韩语单说话者语音数据集,包含由专业女演员录制的音频文件及其对齐的文本。文本来源于作者的书籍,数据集包含12,853个音频文件,总时长超过12小时,采样率为44,100 KHZ。数据集的文件格式、来源、许可证、引用方式、联系信息等都有详细说明。数据集的结构包括音频文件路径、原始脚本、扩展脚本、分解脚本、音频时长和英文翻译等信息。
annotations_creators:
- 专家生成
language_creators:
- 专家生成
language:
- 韩语(ko)
license:
- CC BY-NC-SA 4.0
multilinguality:
- 单语言
pretty_name: 韩语单说话人语音数据集
size_categories:
- 10K<n<100K
source_datasets:
- 原始数据集
task_categories:
- 文本转语音(text-to-speech)
task_ids: []
## 数据集说明
- **主页:** [韩语单说话人语音数据集](https://www.kaggle.com/datasets/bryanpark/korean-single-speaker-speech-dataset)
- **代码仓库:** [Kyubyong/kss](https://github.com/Kyubyong/kss)
- **相关论文:** 无
- **排行榜:** 无
- **联系人:** 无
# 原作者说明
### KSS数据集:韩语单说话人语音数据集
本数据集专为韩语**文本转语音(text-to-speech)**任务设计,包含由专业女性配音演员录制的音频文件,以及从本人著作中提取的对齐文本。作为著作权持有人,经出版社授权,我将本数据集公开发布。据我所知,这是首个面向韩语的公开可用语音数据集。
### 文件格式
`transcript.v.1.3.txt`中的每一行均以竖线`|`分隔为六个字段:
- A. 音频文件路径
- B. 原始脚本
- C. 展开式脚本
- D. 分解式脚本
- E. 音频时长(秒)
- F. 英文译文
示例:
1/1_0470.wav|저는 보통 20분 정도 낮잠을 잡니다.|저는 보통 이십 분 정도 낮잠을 잡니다.|저는 보통 이십 분 정도 낮잠을 잡니다.|4.1|我通常会小睡20分钟左右。
### 数据集规格
- 音频文件格式:WAV
- 总时长:12小时以上
- 采样率:44100千赫兹
- 音频文件总数:12853条
- 数据来源
1. [朴奎炳,《500个基础韩语动词》,Tuttle Publishing,2015.](https://www.amazon.com/500-Basic-Korean-Verbs-Comprehensive/dp/0804846057/ref=sr_1_1?s=books&ie=UTF8&qid=1522911616&sr=1-1&keywords=kyubyong+park)
2. [朴奎炳,《500个基础韩语形容词(第2版)》,Youkrak,2015.](http://www.hanbooks.com/500bakoad.html)
3. [朴奎炳,《核心韩语词汇》,Tuttle Publishing,2015.](https://www.amazon.com/Essential-Korean-Vocabulary-Phrases-Fluently/dp/0804843252/ref=sr_1_3?s=books&ie=UTF8&qid=1522911806&sr=1-3&keywords=kyubyong+park)
4. [朴奎炳,《Tuttle学习者韩英词典》,Tuttle Publishing,2012.](https://www.amazon.com/Tuttle-Learners-Korean-English-Dictionary-Essential/dp/0804841500/ref=sr_1_8?s=books&ie=UTF8&qid=1522911806&sr=1-8&keywords=kyubyong+park)
### 许可协议
本数据集采用CC BY-NC-SA 4.0协议。**严禁将本数据集用于任何商业用途**,除此之外可自由使用。
### 引用格式
若需引用本数据集,请参照以下格式:
> 朴奎炳,KSS数据集:韩语单说话人语音数据集,https://kaggle.com/bryanpark/korean-single-speaker-speech-dataset,2018
### 参考案例
可查阅[此项目](https://github.com/Kyubyong/kss)了解使用本数据集的相关工程实现。
### 联系方式
可通过邮箱`kbpark.linguist@gmail.com`与作者联系。
2018年4月
朴奎炳
### 数据集概览
本数据集包含12853条带转录文本的韩语音频文件。
### 支持任务与排行榜
文本转语音(text-to-speech),无公开排行榜。
### 语言
韩语
## 数据集结构
### 数据实例
python
>>> from datasets import load_dataset
>>> dataset = load_dataset("Bingsu/KSS_Dataset")
>>> dataset["train"].features
{'audio': Audio(sampling_rate=44100, mono=True, decode=True, id=None),
'original_script': Value(dtype='string', id=None),
'expanded_script': Value(dtype='string', id=None),
'decomposed_script': Value(dtype='string', id=None),
'duration': Value(dtype='float32', id=None),
'english_translation': Value(dtype='string', id=None)}
python
>>> dataset["train"][0]
{'audio': {'path': None,
'array': array([ 0.00000000e+00, 3.05175781e-05, -4.57763672e-05, ...,
0.00000000e+00, -3.05175781e-05, -3.05175781e-05]),
'sampling_rate': 44100},
'original_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.',
'expanded_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.',
'decomposed_script': '그는 괜찮은 척하려고 애쓰는 것 같았다.',
'duration': 3.5,
'english_translation': 'He seemed to be pretending to be okay.'}
### 数据划分
| | 训练集 |
|---------------|------:|
| 样本总数 | 12853 |
提供机构:
Bingsu
原始信息汇总
数据集概述
- 名称: Korean Single Speaker Speech Dataset
- 语言: 韩语(ko)
- 许可证: CC-BY-NC-SA-4.0
- 多语言性: 单语种
- 大小: 10K<n<100K
- 源数据集: 原始数据
- 任务类别: 文本到语音(text-to-speech)
数据集详细描述
- 音频文件类型: wav
- 总运行时间: 超过12小时
- 采样率: 44,100 KHZ
- 音频文件数量: 12,853
- 文件格式: 每个
transcript.v.1.3.txt文件中的行由|分隔成六个字段,包括音频文件路径、原始脚本、扩展脚本、分解脚本、音频时长和英文翻译。
数据集结构
- 数据实例: 每个实例包含音频数据及其相关的脚本和翻译信息。
- 数据分割: 数据集包含一个训练集,共有12,853个实例。
许可证信息
- 使用限制: 不可用于任何商业目的。
引用信息
- 引用格式: Kyubyong Park, KSS Dataset: Korean Single speaker Speech Dataset, https://kaggle.com/bryanpark/korean-single-speaker-speech-dataset, 2018



