five

yue_emo_speech

收藏
魔搭社区2025-12-05 更新2025-03-08 收录
下载链接:
https://modelscope.cn/datasets/pengzhendong/yue_emo_speech
下载链接
链接失效反馈
官方服务:
资源简介:
# Cantonese Emotional Speech Crawled from YouTube and RTHK, this dataset contains 1,000 hours of Cantonese speech, each labeled with one of the following emotions: angry, disgusted, fearful, happy, neutral, other, sad, or surprised. The dataset also includes the confidence of the emotion label. The audio files are denoised with [resemble-enhance](https://github.com/resemble-ai/resemble-enhance). The transcriptions are generated by [SenseVoiceSmall](https://huggingface.co/FunAudioLLM/SenseVoiceSmall), and deduplicated using MinHash.

# 粤语情感语音数据集 本数据集从YouTube及香港电台(RTHK)爬取采集,共收录1000小时粤语语音数据,每条语音均标注有以下情感类别之一:愤怒、厌恶、恐惧、喜悦、中性、其他、悲伤或惊讶。本数据集同时附带情感标签的置信度评分。音频文件已通过[resemble-enhance](https://github.com/resemble-ai/resemble-enhance)工具完成降噪预处理。语音转写文本由[SenseVoiceSmall](https://huggingface.co/FunAudioLLM/SenseVoiceSmall)生成,并通过最小哈希(MinHash)算法进行去重处理。
提供机构:
maas
创建时间:
2025-03-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
yue_emo_speech是一个包含1000小时粤语情感语音的数据集,每条语音标注了8种情感标签,并经过降噪和去重处理。数据集适用于语音情感识别等任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作