Rexhaif/ru-med-ner
收藏Hugging Face2022-05-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Rexhaif/ru-med-ner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为ru-med-ner,是一个针对俄语的命名实体识别(NER)数据集,数据来源于医疗记录。数据集包含了医疗记录中的文本数据,每个数据实例由一组单词和对应的NER标签组成。数据集的目的是支持俄语医疗文本的命名实体识别任务。
提供机构:
Rexhaif
原始信息汇总
ru-med-ner数据集概述
数据集描述
数据集总结
- 类型: 命名实体识别(NER)数据集
- 语言: 俄语(ru-RU)
- 来源: 从医疗记录中提取
- 详细信息: 参见RuMedBench
支持的任务和排行榜
- 信息: 待补充
语言
- 语言代码: ru-RU
数据集结构
数据实例
- 示例: javascript {"idx": "2472239.tsv_0", "tokens": ["", "?5@2K9", "65", "45=L", "?@8<5=5=8O", "2K?8;0", "5", "B01;5B>:", ",", "?@>A=C;0AL", "=>GLN", "8", "A>=", ":0:", ">B18;>", "."], "ner_tags": ["O", "O", "O", "O", "O", "O", "O", "B-Drugform", "O", "B-ADR", "O", "O", "B-ADR", "I-ADR", "I-ADR", "O"]}
数据字段
- idx: 示例ID
- tokens: 示例中的单词列表
- ner_tags: 命名实体标签
附加信息
引用信息
-
文献:
@misc{blinov2022rumedbench, title={RuMedBench: A Russian Medical Language Understanding Benchmark}, author={Pavel Blinov and Arina Reshetnikova and Aleksandr Nesterov and Galina Zubkova and Vladimir Kokh}, year={2022}, eprint={2201.06499}, archivePrefix={arXiv}, primaryClass={cs.CL} }



