five

bigbio/bioid

收藏
Hugging Face2023-02-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/bioid
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en bigbio_language: - English license: other bigbio_license_shortname: UNKNOWN multilinguality: monolingual pretty_name: Bio-ID homepage: https://biocreative.bioinformatics.udel.edu/tasks/biocreative-vi/track-1/ bigbio_pubmed: true bigbio_public: true bigbio_tasks: - NAMED_ENTITY_RECOGNITION - NAMED_ENTITY_DISAMBIGUATION --- # Dataset Card for Bio-ID ## Dataset Description - **Homepage:** https://biocreative.bioinformatics.udel.edu/tasks/biocreative-vi/track-1/ - **Pubmed:** True - **Public:** True - **Tasks:** NER,NED The Bio-ID track focuses on entity tagging and ID assignment to selected bioentity types. The task is to annotate text from figure legends with the entity types and IDs for taxon (organism), gene, protein, miRNA, small molecules, cellular components, cell types and cell lines, tissues and organs. The track draws on SourceData annotated figure legends (by panel), in BioC format, and the corresponding full text articles (also BioC format) provided for context. ## Citation Information ``` @inproceedings{arighi2017bio, title={Bio-ID track overview}, author={Arighi, Cecilia and Hirschman, Lynette and Lemberger, Thomas and Bayer, Samuel and Liechti, Robin and Comeau, Donald and Wu, Cathy}, booktitle={Proc. BioCreative Workshop}, volume={482}, pages={376}, year={2017} } ```
提供机构:
bigbio
原始信息汇总

数据集概述:Bio-ID

数据集描述

  • 语言: 英语
  • 许可证: 未知
  • 多语言性: 单语种
  • 名称: Bio-ID
  • 主页: BioCreative VI Track 1
  • 是否公开: 是
  • 是否包含PubMed数据: 是
  • 任务类型:
    • 命名实体识别 (NER)
    • 命名实体消歧 (NED)

数据集内容

Bio-ID 数据集专注于生物实体类型的实体标记和ID分配,主要针对图例文本进行标注,包括生物实体类型如物种、基因、蛋白质、miRNA、小分子、细胞组分、细胞类型和细胞系、组织和器官。数据集基于SourceData注释的图例(按面板),采用BioC格式,并提供相应的全文文章(同样为BioC格式)作为上下文。

引用信息

@inproceedings{arighi2017bio, title={Bio-ID track overview}, author={Arighi, Cecilia and Hirschman, Lynette and Lemberger, Thomas and Bayer, Samuel and Liechti, Robin and Comeau, Donald and Wu, Cathy}, booktitle={Proc. BioCreative Workshop}, volume={482}, pages={376}, year={2017} }

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Bio-ID数据集专注于生物医学文本中的实体标注和ID分配任务,包括生物实体类型如基因、蛋白质等,采用BioC格式基于SourceData标注的图例和全文文章构建。该数据集支持命名实体识别(NER)和命名实体消歧(NED),用于生物信息学研究和应用,但使用前需安装bioc依赖项。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作