five

ICSI Meeting Corpus

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/guokan-shang/ami-and-icsi-corpora
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一组用于测试说话人语音分割算法的音频样本集合。此外,该数据集还被用于评估所提出的双向长短期记忆(Bi-LSTM)评分模型的表现,该模型在说话人语音分割任务中取得了较低的分割错误率(DER),为34.80%。

This dataset comprises a set of audio samples intended for testing speaker speech segmentation algorithms. Furthermore, this dataset is also utilized to assess the performance of the proposed bidirectional long short-term memory (Bi-LSTM) scoring model, which attained a low segmentation error rate (DER) of 34.80% in the speaker speech segmentation task.
提供机构:
ICSI
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ICSI Meeting Corpus是一个包含会议转录和多种注释(如对话行为、摘要、主题分割)的数据集,已转换为JSON格式。数据集适用于自然语言处理和会议摘要研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作