five

GenSEC-LLM/SLT-Task3-Post-ASR-Emotion-Recognition

收藏
Hugging Face2024-06-15 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/GenSEC-LLM/SLT-Task3-Post-ASR-Emotion-Recognition
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含11个语音模型的ASR转录文本,这些转录文本遵循IEMOCAP对话的轮次,并包含相应的说话者ID和话语ID。数据集的使用需要先获取IEMOCAP的许可。每个条目包含多个键,如`need_prediction`表示是否需要预测,`emotion`表示情感标签,`id`表示话语ID,`speaker`表示说话者,`groundtruth`表示原始人类转录文本。此外,还有十个键表示由相应ASR模型生成的转录文本。

This dataset consists of ASR transcripts of 11 speech models, following the turns of the conversation in IEMOCAP, with corresponding speaker ID and utterance ID. To use this dataset, one must first obtain the license of IEMOCAP. Each entry contains multiple keys, such as `need_prediction` indicating whether the utterance should be included in the prediction procedure, `emotion` indicating the emotion label, `id` indicating the utterance ID, `speaker` indicating the speaker, and `groundtruth` indicating the original human transcription. Additionally, there are ten keys representing the ASR transcription generated by respective ASR models.
提供机构:
GenSEC-LLM
原始信息汇总

数据集名称

ASR transcripts of IEMOCAP for ASR error correction and emotion recognition

数据集描述

本数据集包含11种语音模型的ASR转录,按照IEMOCAP中的对话轮次进行,每个转录对应有说话者ID和话语ID。

数据集内容

  • need_prediction: 指示该话语是否应包含在预测过程中。"yes"表示标记有Big4情绪的话语,这些话语广泛用于IEMOCAP中的情绪识别。"no"表示所有其他话语。已移除无人标注的话语。
  • emotion: 指示话语的情绪标签。
  • id: 指示话语ID,也是IEMOCAP语料库中音频文件的名称。ID与IEMOCAP中的原始ID完全相同。
  • speaker: 指示话语的说话者。每个会话中有两位说话者,总共十位说话者。注意,ID的第六个字符不代表说话者的性别,而是当前佩戴动作捕捉设备的人的性别。请使用我们提供的说话者作为说话者ID。
  • groundtruth: 指示由IEMOCAP提供的原始人类转录。
  • 剩余十个键表示由各自ASR模型生成的ASR转录。

数据集访问

注册后,数据集将共享给您。

致谢

本数据集基于IEMOCAP创建。感谢IEMOCAP的原始作者,并感谢Shrikanth Narayanan教授的批准。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作