five

HI-MIA

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-173.html
下载链接
链接失效反馈
官方服务:
资源简介:
The data is used in AISHELL Speaker Verification Challenge 2019. It is extracted from a larger database called AISHELL-WakeUp-1. The contents are wake-up words "Hi, Mia" in both Chinese and English. The data is collected in real home environment using microphone arrays and Hi-Fi microphone. The collection process and development of a baseline system was described in the paper below. The data used in the challenge is extracted from 1 Hi-Fi microphone and 16-channel circular microphone arrays for 1/3/5 meters. And the contents are the Chinese wake-up words. The whole set is divided into train (254 people), dev (42 people) and test (44 people) subsets. Test subset is provided with paired target/non-target answer to evaluate verification results.

本数据集应用于AISHELL 2019说话人验证挑战赛,其源自一个名为AISHELL-WakeUp-1的更大规模数据库。数据集内容为中英文双语的唤醒词(wake-up word)"Hi, Mia",通过麦克风阵列与高保真(Hi-Fi)麦克风在真实家庭环境中采集得到。其采集流程与基线系统的开发细节已在如下论文中详述。本次挑战赛所用的数据仅源自1支高保真麦克风以及16通道环形麦克风阵列,采集距离覆盖1米、3米及5米,且仅包含中文唤醒词。整个数据集被划分为训练子集(254名说话人)、开发子集(42名说话人)与测试子集(44名说话人)。测试子集配备了目标/非目标配对标注结果,用于评估说话人验证任务的性能表现。
提供机构:
帕依提提
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HI-MIA是一个用于说话人验证的中英文唤醒词数据集,采集自真实家庭环境,包含高保真麦克风和16通道圆形麦克风阵列在不同距离下的录音。数据集专为AISHELL 2019挑战赛设计,分为训练、开发和测试三个子集,主要用于唤醒词识别和说话人验证研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作