SIRIS-Lab/AIObioEnts-model_files
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SIRIS-Lab/AIObioEnts-model_files
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含AIObioEnts的模型文件,这些文件是使用AIONER训练的,并基于四种不同的预训练模型。这些模型用于识别文本数据中的核心生物医学实体,如基因、疾病、细胞系、化学物质、物种和变体。此外,还包括使用AnatEM语料库中的选定实体进行微调的模型,这些实体包括细胞组件、组织、器官、多组织结构和癌症。
This dataset contains the model files for AIObioEnts, trained using AIONER with 4 different pre-trained models. These models are used for the identification of core biomedical entities—gene, disease, cell line, chemical, species, variant—in textual data. Additionally, it includes models fine-tuned with selected entities from the AnatEM corpus—cell component, tissue, organ, multi-tissue structure, cancer.
提供机构:
SIRIS-Lab
原始信息汇总
AIObioEnts 模型文件数据集
概述
- 任务类别:
- 令牌分类 (Token Classification)
- 标签:
- BioNER (生物医学命名实体识别)
- Biomedical NER (生物医学命名实体识别)
数据集内容
- 包含用于 AIObioEnts 的模型文件。
- 使用 AIONER 训练,基于以下四种预训练模型:
- BiomedBERT-base:
- 预训练于 PubMed 摘要。
- 预训练于 PubMed 摘要和 PubMedCentral 全文文章。
- BioLinkBERT-base
- BioLinkBERT large
- BiomedBERT-base:
目标
- 识别文本数据中的核心生物医学实体,包括基因、疾病、细胞系、化学物质、物种、变异。
- 针对 AnatEM 语料库中的选定实体进行微调,包括细胞成分、组织、器官、多组织结构、癌症。



