five

RuMedNLI: A Russian Natural Language Inference Dataset For The Clinical Domain

收藏
physionet.org2025-01-22 收录
下载链接:
https://physionet.org/content/rumednli-russian-inference/1.0.0/
下载链接
链接失效反馈
官方服务:
资源简介:
There is a shortage of text medical resources for the Russian language. This is a substantial obstacle in state-of-the-art NLP deep learning models research and development. To mitigate this issue we translated the MedNLI data from English to Russian. The RuMedNLI task became part of the RuMedBench: Russian Medical Language Understanding Benchmark. MedNLI is a dataset based on MIMIC-III records and annotated by doctors performing a natural language inference task (NLI) grounded in the medical history of patients. RuMedNLI is the full counterpart dataset of MedNLI in the Russian language.

俄罗斯语医学文本资源匮乏,这构成了对最先进自然语言处理深度学习模型研究与发展的一项重大障碍。为缓解这一问题,我们对MedNLI数据集进行了从英语到俄语的翻译。RuMedNLI任务因此成为RuMedBench:俄罗斯医学语言理解基准测试的一部分。MedNLI是一个基于MIMIC-III记录并经医生标注的自然语言推理(NLI)任务数据集,其推理基础建立在患者病历之上。RuMedNLI是MedNLI在俄语中的完整对应数据集。
提供机构:
physionet.org
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作