PxSLU
收藏arXiv2022-07-18 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.6482586
下载链接
链接失效反馈官方服务:
资源简介:
PxSLU数据集是由格勒诺布尔-阿尔卑斯大学等机构创建的,专注于法语口语医疗处方理解的首个口语医疗处方语料库。该数据集包含约4小时的转录和标注对话,涉及55名参与者,包括专家和非专家。数据集内容丰富,包含1981条录音,涵盖了医疗处方的各个方面。创建过程中,通过智能手机上的对话系统收集数据,并进行了人工转录和语义标注。PxSLU数据集的应用领域广泛,主要用于评估和开发医疗对话系统,以提高医疗服务的可及性和患者护理的质量与可追溯性。
The PxSLU dataset, created by institutions including the University of Grenoble Alpes, is the first spoken medical prescription corpus focusing on French spoken medical prescription understanding. This dataset contains approximately 4 hours of transcribed and annotated dialogues, involving 55 participants including both experts and non-experts. It has rich content with 1981 recordings covering all aspects of medical prescriptions. During its creation, data was collected via a dialogue system on smartphones, followed by manual transcription and semantic annotation. The PxSLU dataset has a wide range of application scenarios, and is mainly used for evaluating and developing medical dialogue systems to improve the accessibility of medical services as well as the quality and traceability of patient care.
提供机构:
格勒诺布尔-阿尔卑斯大学, 法国国家科学研究中心, 法国国家信息与自动化研究所, 格勒诺布尔理工学院, 格勒诺布尔信息实验室
创建时间:
2022-07-18
搜集汇总
数据集介绍

构建方式
在医疗信息化领域,口语药物处方数据的匮乏制约了语音理解系统的发展。PxSLU数据集通过设计一个人机对话原型系统,面向智能手机平台采集法语口语药物处方数据。实验招募了55名参与者,包括医学专家与非专家,在自然环境下自主完成处方录入任务。非专家参与者直接朗读文本处方,而医学专家则借助图标式处方示意图进行更贴近临床实践的交互。所有对话被自动语音识别转录后,由两名母语者进行人工校对与语义标注,最终形成包含903个对话会话、1981条语音记录、约4小时时长的语料库。
特点
该数据集具有鲜明的领域特色与实用性。作为首个公开的口语药物处方语料库,PxSLU涵盖了5种对话意图与40种语义标签,能够全面表征处方中的药物名称、剂型、剂量、用药频率与疗程等关键信息。数据分布呈现自然的不平衡性,强制性信息如药品名与用量出现频次较高,而附加说明如空腹服用等则相对稀疏,真实反映了临床处方的语言规律。此外,数据集在参与者年龄、性别与专业背景上保持均衡,且通过CC BY 4.0许可协议开放共享,为多语言医疗语音理解研究提供了宝贵资源。
使用方法
PxSLU数据集以对齐的conll格式发布,可直接用于口语语言理解系统的训练与评估。研究者可将其用作基准测试集,评估基于条件随机场、循环神经网络或预训练语言模型(如Flaubert)在药物处方意图识别与槽位填充任务上的表现。实验表明,利用该数据集对Flaubert模型进行微调,可获得与大规模人工数据集训练相当的性能,尤其在宏平均指标上展现了处理稀有语义标签的鲁棒性。数据集还支持对话建模与语音识别后处理等扩展研究,为构建端到端的医疗对话系统奠定了数据基础。
背景与挑战
背景概述
在医疗信息化浪潮中,口语对话系统正逐步渗透至临床工作流,旨在优化患者护理的可追溯性与医疗人员的操作效率。然而,现有医疗自然语言处理资源多集中于英文文本形式,严重制约了非英语环境下口语理解系统的发展。在此背景下,由法国格勒诺布尔阿尔卑斯大学、格勒诺布尔大学医院及Calystene公司联合团队于2022年创建的PxSLU数据集应运而生。该数据集聚焦于法语口语药物处方理解这一核心研究问题,通过55名参与者(涵盖医生、药剂师及非专业人员)与原型对话系统的真实交互,采集了约4小时的语音录音,并完成了人工转写与语义标注。作为首个公开可用的口语药物处方语料库,PxSLU弥补了该领域法语资源的空白,为口语语言理解在医疗场景的落地提供了宝贵的基准测试平台。
当前挑战
PxSLU数据集所面临的挑战主要体现在两个层面。在领域问题层面,口语药物处方理解需从非结构化的自然语音中精确抽取药物名称、剂量、频次、疗程等关键信息,并应对口语中常见的犹豫、重复、修正等不流畅现象,这对意图识别与语义槽填充的鲁棒性提出了极高要求。此外,处方信息存在严重的长尾分布,如空腹服用等可选属性出现频率极低,加剧了类别不平衡问题。在构建过程中,挑战同样显著:数据采集需在疫情期间通过远程方式完成,参与者需在无实验员指导的环境下自主操作;同时,为获取自然流畅的处方表达,专家参与者采用图像化刺激而非文本朗读,但该方法耗时较长;此外,自动语音识别系统在专业医学术语与口语化表达上的词错误率高达21%-28%,为后续人工转写与标注工作增添了巨大负担。
常用场景
经典使用场景
在医疗对话系统与口语语言理解领域,PxSLU数据集为研究者提供了一个弥足珍贵的基准资源。其核心应用场景在于构建与评估面向药物处方的智能语音交互系统,特别是针对智能手机端的口语处方录入任务。该数据集包含了近4小时的法语口语对话录音,涵盖医生、药剂师等医疗专家与普通参与者在真实人机交互环境中的自然对话,并配有详尽的转写与语义标注。这使得研究者能够系统性地训练和测试从语音到结构化处方信息的端到端理解模型,从而推动医疗领域口语对话系统的实用化进程。
实际应用
在实际应用中,PxSLU数据集直接服务于智能医疗助手与电子处方系统的开发。基于该数据集训练的语音理解模型可被集成到医院信息系统或处方辅助软件中,允许医生通过智能手机以自然口语完成处方录入,从而解放双手、提升诊疗效率,并减少因手动输入导致的错误。此外,该数据集还支持构建能够识别药物相互作用、验证处方完整性的智能对话代理,在临床实践中帮助医疗从业者更便捷地遵循用药规范,同时增强患者用药的可追溯性与安全性。
衍生相关工作
PxSLU数据集的发布催生了一系列后续研究工作,尤其是在法语医疗口语理解模型的迁移学习与微调方面。研究者基于该数据集对Flaubert等预训练语言模型进行了领域自适应微调,证明了小样本口语数据能够有效提升模型在处方理解任务上的宏平均与微平均性能。此外,该数据集还被用于比较传统条件随机场与基于注意力机制的循环神经网络在槽填充与意图识别上的差异,为后续设计更鲁棒的医疗对话系统提供了实证基础。这些衍生工作不仅深化了对口语处方语言特性的理解,也为跨语言医疗NLP研究树立了典范。
以上内容由遇见数据集搜集并总结生成



