AliMeeting
收藏OpenDataLab2026-05-24 更新2024-06-08 收录
下载链接:
https://opendatalab.org.cn/ModelScope/AliMeeting
下载链接
链接失效反馈官方服务:
资源简介:
AliMeeting总共包含118.75小时的语音数据,包括104.75小时的训练集(Train)、4小时的验证集(Eval)和10小时的测试集(Test)。训练集和验证集分别包含212场和8场会议,其中每场会议由多个说话人进行15到30分钟的讨论。
AliMeeting contains a total of 118.75 hours of speech data, split into three subsets: 104.75 hours for the training set (Train), 4 hours for the validation set (Eval), and 10 hours for the test set (Test). The training and validation sets respectively include 212 and 8 meetings, with each meeting involving multiple speakers holding discussions lasting 15 to 30 minutes.
提供机构:
ModelScope
创建时间:
2024-05-17
搜集汇总
数据集介绍

背景与挑战
背景概述
AliMeeting是一个包含120小时中文会议语音的数据集,涵盖多种会议场景和主题,提供远场和近场的多通道录音,适用于多说话人转录研究。数据集分为训练集、验证集和测试集,具有较高的语音重叠率和多样化的声学环境。
以上内容由遇见数据集搜集并总结生成



