five

AliMeeting

收藏
OpenDataLab2026-04-19 更新2024-06-08 收录
下载链接:
https://opendatalab.org.cn/ModelScope/AliMeeting
下载链接
链接失效反馈
资源简介:
AliMeeting总共包含118.75小时的语音数据,包括104.75小时的训练集(Train)、4小时的验证集(Eval)和10小时的测试集(Test)。训练集和验证集分别包含212场和8场会议,其中每场会议由多个说话人进行15到30分钟的讨论。
提供机构:
ModelScope
创建时间:
2024-05-17
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AliMeeting是一个包含120小时中文会议语音的数据集,涵盖多种会议场景和主题,提供远场和近场的多通道录音,适用于多说话人转录研究。数据集分为训练集、验证集和测试集,具有较高的语音重叠率和多样化的声学环境。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作