english-conversation-corpus
收藏数据集概述
数据来源
- 数据集包含66个公开视频,来源于YouTube上的English Conversation频道。
数据内容
- 视频内容为英语对话。
注释信息
- 注释文件位于
conversations目录下。 - 说话者标签仅针对单个视频,不跨视频共享。
使用方法
- 音频和视频下载:使用
download-audio.sh和download-video.sh脚本。 - 音频分割:运行
segment.py脚本将音频分割成话语单元。
版权说明
- 注释和脚本版权属于数据集创建者,遵循GPLv3许可。
- 音频和视频版权属于YouTube的English Conversation频道,数据集仅用于非商业研究或教育目的。
引用信息
- 引用该数据集时,请参考ICASSP 2022论文。
bibtex @inproceedings{li_enhancing_2022, title = {Enhancing {Speaking} {Styles} in {Conversational} {Text}-to-{Speech} {Synthesis} with {Graph}-{Based} {Multi}-{Modal} {Context} {Modeling}}, copyright = {All rights reserved}, doi = {10.1109/ICASSP43922.2022.9747837}, booktitle = {{ICASSP} 2022 - 2022 {IEEE} {International} {Conference} on {Acoustics}, {Speech} and {Signal} {Processing} ({ICASSP})}, author = {Li, Jingbei and Meng, Yi and Li, Chenyi and Wu, Zhiyong and Meng, Helen and Weng, Chao and Su, Dan}, year = {2022}, note = {ISSN: 2379-190X}, keywords = {Speech, Recurrent neural networks, Acoustics, Conferences, Data mining, Signal processing, Speech enhancement, speaking style, conversational text-to-speech synthesis, graph neural network}, pages = {7917--7921}, }




