AliMeeting
收藏OpenDataLab2026-04-19 更新2024-06-08 收录
下载链接:
https://opendatalab.org.cn/ModelScope/AliMeeting
下载链接
链接失效反馈资源简介:
AliMeeting总共包含118.75小时的语音数据,包括104.75小时的训练集(Train)、4小时的验证集(Eval)和10小时的测试集(Test)。训练集和验证集分别包含212场和8场会议,其中每场会议由多个说话人进行15到30分钟的讨论。
提供机构:
ModelScope
创建时间:
2024-05-17
搜集汇总
数据集介绍

背景与挑战
背景概述
AliMeeting是一个包含120小时中文会议语音的数据集,涵盖多种会议场景和主题,提供远场和近场的多通道录音,适用于多说话人转录研究。数据集分为训练集、验证集和测试集,具有较高的语音重叠率和多样化的声学环境。
以上内容由遇见数据集搜集并总结生成



