five

bigbio/seth_corpus

收藏
Hugging Face2022-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/seth_corpus
下载链接
链接失效反馈
官方服务:
资源简介:
SETH Corpus是一个用于SNP(单核苷酸多态性)命名实体识别的语料库,包含630篇PubMed引文。该数据集支持命名实体识别(NER)和关系抽取(RE)任务。
提供机构:
bigbio
原始信息汇总

SETH Corpus 数据集概述

基本信息

  • 语言: 英语
  • 许可证: Apache-2.0
  • 多语言性: 单语种
  • 数据集名称: SETH Corpus
  • 主页: https://github.com/rockt/SETH
  • 是否公开: 是
  • 是否可在PubMed上访问: 是

任务类型

  • 命名实体识别 (NER)
  • 关系抽取 (RE)

数据集详情

  • 组成: 包含630篇PubMed引文,用于SNP命名实体识别。

引用信息

@Article{SETH2016, Title = {SETH detects and normalizes genetic variants in text.}, Author = {Thomas, Philippe and Rockt{"{a}}schel, Tim and Hakenberg, J{"{o}}rg and Lichtblau, Yvonne and Leser, Ulf}, Journal = {Bioinformatics}, Year = {2016}, Month = {Jun}, Doi = {10.1093/bioinformatics/btw234}, Language = {eng}, Medline-pst = {aheadofprint}, Pmid = {27256315}, Url = {http://dx.doi.org/10.1093/bioinformatics/btw234} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作