HI-MIA

Name: HI-MIA
Creator: 帕依提提
License: 暂无描述

帕依提提2024-03-04 收录

下载链接：

https://www.payititi.com/opendatasets/show-173.html

下载链接

链接失效反馈

官方服务：

资源简介：

The data is used in AISHELL Speaker Verification Challenge 2019. It is extracted from a larger database called AISHELL-WakeUp-1. The contents are wake-up words "Hi, Mia" in both Chinese and English. The data is collected in real home environment using microphone arrays and Hi-Fi microphone. The collection process and development of a baseline system was described in the paper below. The data used in the challenge is extracted from 1 Hi-Fi microphone and 16-channel circular microphone arrays for 1/3/5 meters. And the contents are the Chinese wake-up words. The whole set is divided into train (254 people), dev (42 people) and test (44 people) subsets. Test subset is provided with paired target/non-target answer to evaluate verification results.

本数据集应用于AISHELL 2019说话人验证挑战赛，其源自一个名为AISHELL-WakeUp-1的更大规模数据库。数据集内容为中英文双语的唤醒词（wake-up word）"Hi, Mia"，通过麦克风阵列与高保真（Hi-Fi）麦克风在真实家庭环境中采集得到。其采集流程与基线系统的开发细节已在如下论文中详述。本次挑战赛所用的数据仅源自1支高保真麦克风以及16通道环形麦克风阵列，采集距离覆盖1米、3米及5米，且仅包含中文唤醒词。整个数据集被划分为训练子集（254名说话人）、开发子集（42名说话人）与测试子集（44名说话人）。测试子集配备了目标/非目标配对标注结果，用于评估说话人验证任务的性能表现。

提供机构：

帕依提提

搜集汇总

数据集介绍

背景与挑战

背景概述

HI-MIA是一个用于说话人验证的中英文唤醒词数据集，采集自真实家庭环境，包含高保真麦克风和16通道圆形麦克风阵列在不同距离下的录音。数据集专为AISHELL 2019挑战赛设计，分为训练、开发和测试三个子集，主要用于唤醒词识别和说话人验证研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集