five

SIRIS-Lab/AIObioEnts-model_files

收藏
Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SIRIS-Lab/AIObioEnts-model_files
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含AIObioEnts的模型文件,这些文件是使用AIONER训练的,并基于四种不同的预训练模型。这些模型用于识别文本数据中的核心生物医学实体,如基因、疾病、细胞系、化学物质、物种和变体。此外,还包括使用AnatEM语料库中的选定实体进行微调的模型,这些实体包括细胞组件、组织、器官、多组织结构和癌症。

This dataset contains the model files for AIObioEnts, trained using AIONER with 4 different pre-trained models. These models are used for the identification of core biomedical entities—gene, disease, cell line, chemical, species, variant—in textual data. Additionally, it includes models fine-tuned with selected entities from the AnatEM corpus—cell component, tissue, organ, multi-tissue structure, cancer.
提供机构:
SIRIS-Lab
原始信息汇总

AIObioEnts 模型文件数据集

概述

  • 任务类别:
    • 令牌分类 (Token Classification)
  • 标签:
    • BioNER (生物医学命名实体识别)
    • Biomedical NER (生物医学命名实体识别)

数据集内容

  • 包含用于 AIObioEnts 的模型文件。
  • 使用 AIONER 训练,基于以下四种预训练模型:
    • BiomedBERT-base:
      • 预训练于 PubMed 摘要。
      • 预训练于 PubMed 摘要和 PubMedCentral 全文文章。
    • BioLinkBERT-base
    • BioLinkBERT large

目标

  • 识别文本数据中的核心生物医学实体,包括基因、疾病、细胞系、化学物质、物种、变异。
  • 针对 AnatEM 语料库中的选定实体进行微调,包括细胞成分、组织、器官、多组织结构、癌症。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作