five

a6kme/minds14-mirror

收藏
Hugging Face2023-05-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/a6kme/minds14-mirror
下载链接
链接失效反馈
官方服务:
资源简介:
MInDS-14是一个用于意图检测任务的训练和评估资源,包含来自电子商务领域的14种意图,并提供了14种不同语言和方言的语音示例。数据集支持多种语言,包括英语、法语、意大利语、西班牙语、葡萄牙语、德语、荷兰语、俄语、波兰语、捷克语、韩语和中文。数据集的结构包括音频文件路径、音频对象、转录文本、英文转录文本、意图类别和语言ID。每个配置仅包含一个训练集,大约有600个样本。数据集遵循Creative Commons CC-BY 4.0许可。

MInDS-14 is a training and evaluation resource for intent detection tasks. It encompasses 14 intent categories from the e-commerce domain, alongside speech examples across 14 distinct languages and dialects. The dataset supports multiple languages including English, French, Italian, Spanish, Portuguese, German, Dutch, Russian, Polish, Czech, Korean, and Chinese. Its structure comprises audio file paths, audio objects, transcribed text, English-transcribed text, intent categories, and language IDs. Each dataset configuration contains exactly one training set with approximately 600 samples. The dataset is released under the Creative Commons CC-BY 4.0 license.
提供机构:
a6kme
原始信息汇总

MInDS-14 数据集概述

基本信息

  • 名称: MInDS-14
  • 语言: 支持多种语言,包括英语、法语、意大利语、西班牙语、葡萄牙语、德语、荷兰语、俄语、波兰语、捷克语、韩语、中文等。
  • 语言BCP47: 包括多种英语变体及上述其他语言。
  • 许可证: CC-BY-4.0
  • 多语言性: 多语言
  • 大小: 约500 MB
  • 任务类别: 自动语音识别、语音处理
  • 任务ID: 语音识别、关键词检测

数据集结构

  • 数据实例: 包含音频文件路径、音频数据、转录文本、意图类别等。
  • 数据字段: 包括路径、音频、转录、意图类别等。
  • 数据分割: 仅包含训练集,约600个示例。

使用示例

数据集可通过load_dataset函数加载,支持单语言和多语言下载。示例代码展示了如何加载数据、访问音频样本和意图类别。

数据集创建

数据集的创建涉及专家生成、众包和机器生成的方法。

许可证信息

数据集根据CC-BY-4.0许可证发布。

引用信息

数据集的引用信息如下:

@article{DBLP:journals/corr/abs-2104-08524, author = {Daniela Gerz and Pei{-}Hao Su and Razvan Kusztos and Avishek Mondal and Michal Lis and Eshan Singhal and Nikola Mrksic and Tsung{-}Hsien Wen and Ivan Vulic}, title = {Multilingual and Cross-Lingual Intent Detection from Spoken Data}, journal = {CoRR}, volume = {abs/2104.08524}, year = {2021}, url = {https://arxiv.org/abs/2104.08524}, eprinttype = {arXiv}, eprint = {2104.08524}, timestamp = {Mon, 26 Apr 2021 17:25:10 +0200}, biburl = {https://dblp.org/rec/journals/corr/abs-2104-08524.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }

搜集汇总
数据集介绍
main_image_url
构建方式
在语音识别与意图检测的交叉领域,MInDS-14数据集的构建体现了多语言语音资源的系统性整合。该数据集源自商业电子银行系统,通过专家生成、众包及机器生成相结合的方式,采集了涵盖14种语言变体的口语样本。每个样本均标注了对应的意图类别及转录文本,并统一转化为8kHz采样率的音频格式,确保了数据在跨语言意图检测任务中的一致性与可用性。
特点
MInDS-14数据集的核心特点在于其多语言覆盖与领域特异性。数据集包含14种不同的意图类别,涉及电子银行场景中的常见用户查询,如地址变更、余额查询等。其语言多样性显著,涵盖了英语、法语、中文等14种语言变体,每种语言约含600个训练样本,为跨语言迁移学习提供了丰富资源。每个数据实例均提供原始音频路径、转录文本、英文翻译及意图类别标签,结构清晰,便于模型训练与评估。
使用方法
利用MInDS-14进行模型开发时,研究者可通过Hugging Face的datasets库直接加载特定语言配置或全部多语言数据。数据加载后,音频可实时解码为数组,与意图类别标签结合,适用于语音分类模型的微调。该数据集主要支持意图检测与语音识别任务,用户可依据转录文本与音频数据,构建端到端的语音意图理解系统,或进行跨语言意图检测的对比实验。
背景与挑战
背景概述
MInDS-14数据集由PolyAI等研究机构于2021年构建,旨在为口语数据中的意图检测任务提供训练与评估资源。该数据集聚焦于电子银行领域,涵盖了14种不同的意图类别,并收集了14种语言变体的语音样本,其核心研究问题在于解决多语言及跨语言环境下的口语意图识别。通过融合专家生成、众包及机器生成等多种标注方式,MInDS-14显著推动了语音处理与自动语音识别领域的发展,为构建鲁棒的多语言对话系统奠定了重要基础。
当前挑战
在意图检测领域,MInDS-14致力于应对多语言口语理解中的关键挑战,包括语言多样性带来的语义歧义消除、低资源语言的数据稀疏性问题,以及口语表达中存在的噪声和口音变异。数据构建过程中,面临的主要困难涉及多语言语音样本的采集与对齐,需确保14种语言变体在意图类别上的一致性;同时,标注工作需协调专家与众包资源,以维持转录与意图标签的高质量与可靠性,这些因素共同构成了数据集构建的核心难点。
常用场景
经典使用场景
在语音交互系统领域,MInDS-14数据集为意图检测任务提供了关键的多语言训练资源。其经典使用场景集中于构建跨语言的语音意图识别模型,通过涵盖14种语言变体的口语样本,研究者能够训练模型准确理解用户在电子银行场景下的多样化指令,如地址变更或余额查询。该数据集支持端到端的音频分类微调,为多语言语音处理研究奠定了实验基础。
实际应用
在实际应用中,MInDS-14数据集直接赋能于智能客服与语音助手系统的开发。基于该数据集训练的模型可部署于银行、电商等行业的语音交互平台,实现多语言用户意图的自动识别与分类,提升服务效率与用户体验。其涵盖的电子银行领域意图,如交易查询或账户管理,为金融科技场景提供了定制化的语音理解解决方案。
衍生相关工作
围绕MInDS-14数据集,已衍生出多项经典研究工作。例如,原论文《Multilingual and Cross-Lingual Intent Detection from Spoken Data》提出了跨语言意图检测框架,后续研究在此基础上探索了多任务学习、语音-文本联合表示等方法。这些工作不仅扩展了数据集的用途,还推动了多模态语音理解、低资源语言迁移等方向的技术进展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作