自然语言交互数据库
收藏国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64ef83f6bb16e0591d024daa&type=1
下载链接
链接失效反馈官方服务:
资源简介:
数据库包括双人自然对话的语音和文本,以及对应意图等标注,其主题覆盖了校园教育及生活、养老院、会场、医院、家庭等五个场景,录制时使用专业头戴式耳机麦克风进行单通道近场录音与专业声卡连接电容麦克风进行双通道近远场同时录音。训练集总计50814句文本、79小时音频数据,其中校园场景30135条文本、43小时音频;医疗场景10898条文本、21小时音频;养老院场景3976条文本、7.5小时音频;家庭场景3995句文本、5.5小时音频;会场场景1810条文本、2小时音频。测试集总计2104句文本,3小时音频,均匀覆盖训练集中的五个场景。数据量总计约16GB。
提供机构:
天津大学



