ICSI Meeting Corpus
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/guokan-shang/ami-and-icsi-corpora
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一组用于测试说话人语音分割算法的音频样本集合。此外,该数据集还被用于评估所提出的双向长短期记忆(Bi-LSTM)评分模型的表现,该模型在说话人语音分割任务中取得了较低的分割错误率(DER),为34.80%。
This dataset comprises a set of audio samples intended for testing speaker speech segmentation algorithms. Furthermore, this dataset is also utilized to assess the performance of the proposed bidirectional long short-term memory (Bi-LSTM) scoring model, which attained a low segmentation error rate (DER) of 34.80% in the speaker speech segmentation task.
提供机构:
ICSI
搜集汇总
数据集介绍

背景与挑战
背景概述
ICSI Meeting Corpus是一个包含会议转录和多种注释(如对话行为、摘要、主题分割)的数据集,已转换为JSON格式。数据集适用于自然语言处理和会议摘要研究。
以上内容由遇见数据集搜集并总结生成



