five

Rexhaif/ru-med-ner

收藏
Hugging Face2022-05-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Rexhaif/ru-med-ner
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为ru-med-ner,是一个针对俄语的命名实体识别(NER)数据集,数据来源于医疗记录。数据集包含了医疗记录中的文本数据,每个数据实例由一组单词和对应的NER标签组成。数据集的目的是支持俄语医疗文本的命名实体识别任务。
提供机构:
Rexhaif
原始信息汇总

ru-med-ner数据集概述

数据集描述

数据集总结

  • 类型: 命名实体识别(NER)数据集
  • 语言: 俄语(ru-RU)
  • 来源: 从医疗记录中提取
  • 详细信息: 参见RuMedBench

支持的任务和排行榜

  • 信息: 待补充

语言

  • 语言代码: ru-RU

数据集结构

数据实例

  • 示例: javascript {"idx": "2472239.tsv_0", "tokens": ["", "?5@2K9", "65", "45=L", "?@8<5=5=8O", "2K?8;0", "5", "B01;5B>:", ",", "?@>A=C;0AL", "=>GLN", "8", "A>=", ":0:", ">B18;>", "."], "ner_tags": ["O", "O", "O", "O", "O", "O", "O", "B-Drugform", "O", "B-ADR", "O", "O", "B-ADR", "I-ADR", "I-ADR", "O"]}

数据字段

  • idx: 示例ID
  • tokens: 示例中的单词列表
  • ner_tags: 命名实体标签

附加信息

引用信息

  • 文献:

    @misc{blinov2022rumedbench, title={RuMedBench: A Russian Medical Language Understanding Benchmark}, author={Pavel Blinov and Arina Reshetnikova and Aleksandr Nesterov and Galina Zubkova and Vladimir Kokh}, year={2022}, eprint={2201.06499}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作