five

abid/indonesia-bioner-dataset

收藏
Hugging Face2022-09-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/abid/indonesia-bioner-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Indonesia BioNER数据集来自在线健康咨询平台Alodokter.com,由两位医学医生标注,采用IOB格式的CoNLL格式。数据集包含2017-2020年间医生的2600条医疗回答,标注了两种实体类型:DISORDERS和ANATOMY。主题包括腹泻、HIV-AIDS、肾结石和结核病,这些主题被WHO标记为高风险数据集。数据以印尼语提供,未提供翻译。
提供机构:
abid
原始信息汇总

Indonesia BioNER Dataset 概述

数据来源与标注

  • 数据来源于在线健康咨询平台 Alodokter.com。
  • 由两位医学专家进行标注,使用 IOB 格式。

数据内容

  • 包含 2600 条医生提供的医疗答案,时间跨度为 2017 至 2020 年。
  • 标注实体类型为 DISORDERS 和 ANATOMY。
  • 涉及的医疗主题包括腹泻、HIV-AIDS、肾结石和结核病,被 WHO 标记为高风险数据集。

文件信息

  • 训练集:train.conll,包含 1950 条记录。
  • 验证集:valid.conll,包含 260 条记录。
  • 测试集:test.conll,包含 390 条记录。

语言与许可

  • 数据集语言为印尼语,无翻译版本。
  • 遵循 BSD-3-Clause-Clear 许可。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作