five

MobvoiHotwords

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-182.html
下载链接
链接失效反馈
官方服务:
资源简介:
The MobvoiHotwords is a corpus of wake-up words collected from a commercial smart speaker of Mobvoi. It consists of keyword and non-keyword utterances. For keyword data, keyword utterances contain either 'Hi xiaowen' or 'Nihao Wenwen' are collected. For each keyword, there are about 36k utterances. All keyword data is collected from 788 subjects, ages 3-65, with different distances from the smart speaker (1, 3 and 5 meters). Different noises (typical home environment noises like music and TV) with varying sound pressure levels are played in the background during the collection. The keyword data is identical to the keyword data used in the paper below:

MobvoiHotwords是一套采集自出门问问(Mobvoi)商用智能音箱的唤醒热词语料库。该语料库包含关键词语音与非关键词语音两类样本。其中关键词语音样本均包含“Hi xiaowen”或“Nihao Wenwen”两种唤醒词,每类唤醒词对应约3.6万条语音样本。所有关键词语音样本均采集自788名年龄介于3至65岁的受试者,采集时受试者与智能音箱的距离涵盖1米、3米与5米三种场景。采集过程中,背景会播放不同声压级的典型家庭环境噪声,例如音乐、电视音效等。该关键词语音样本与下述论文中所使用的关键词数据集完全一致:
提供机构:
帕依提提
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MobvoiHotwords是一个商业智能音箱唤醒词语料库,包含约36k条'Hi xiaowen'和'Nihao Wenwen'关键词语音数据,收集自788名3-65岁受试者,在不同距离和背景噪音条件下录制。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作