leduckhai/VietMed-NER
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/leduckhai/VietMed-NER
下载链接
链接失效反馈官方服务:
资源简介:
Medical Spoken Named Entity Recognition数据集是医疗领域的首个口语命名实体识别(NER)数据集,名为VietMed-NER。该数据集包含18种不同的实体类型,是目前世界上实体类型数量最多的口语NER数据集。基线实验结果表明,预训练的多语言模型XLM-R在参考文本和ASR输出上均优于单语言模型,并且编码器模型在NER任务上通常优于序列到序列模型。数据集的转录内容可以通过翻译应用于其他语言。
Medical Spoken Named Entity Recognition数据集是医疗领域的首个口语命名实体识别(NER)数据集,名为VietMed-NER。该数据集包含18种不同的实体类型,是目前世界上实体类型数量最多的口语NER数据集。基线实验结果表明,预训练的多语言模型XLM-R在参考文本和ASR输出上均优于单语言模型,并且编码器模型在NER任务上通常优于序列到序列模型。数据集的转录内容可以通过翻译应用于其他语言。
提供机构:
leduckhai



