five

leduckhai/VietMed-NER

收藏
Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/leduckhai/VietMed-NER
下载链接
链接失效反馈
官方服务:
资源简介:
Medical Spoken Named Entity Recognition数据集是医疗领域的首个口语命名实体识别(NER)数据集,名为VietMed-NER。该数据集包含18种不同的实体类型,是目前世界上实体类型数量最多的口语NER数据集。基线实验结果表明,预训练的多语言模型XLM-R在参考文本和ASR输出上均优于单语言模型,并且编码器模型在NER任务上通常优于序列到序列模型。数据集的转录内容可以通过翻译应用于其他语言。

Medical Spoken Named Entity Recognition数据集是医疗领域的首个口语命名实体识别(NER)数据集,名为VietMed-NER。该数据集包含18种不同的实体类型,是目前世界上实体类型数量最多的口语NER数据集。基线实验结果表明,预训练的多语言模型XLM-R在参考文本和ASR输出上均优于单语言模型,并且编码器模型在NER任务上通常优于序列到序列模型。数据集的转录内容可以通过翻译应用于其他语言。
提供机构:
leduckhai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作