bigbio/seth_corpus
收藏Hugging Face2022-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/seth_corpus
下载链接
链接失效反馈官方服务:
资源简介:
SETH Corpus是一个用于SNP(单核苷酸多态性)命名实体识别的语料库,包含630篇PubMed引文。该数据集支持命名实体识别(NER)和关系抽取(RE)任务。
提供机构:
bigbio
原始信息汇总
SETH Corpus 数据集概述
基本信息
- 语言: 英语
- 许可证: Apache-2.0
- 多语言性: 单语种
- 数据集名称: SETH Corpus
- 主页: https://github.com/rockt/SETH
- 是否公开: 是
- 是否可在PubMed上访问: 是
任务类型
- 命名实体识别 (NER)
- 关系抽取 (RE)
数据集详情
- 组成: 包含630篇PubMed引文,用于SNP命名实体识别。
引用信息
@Article{SETH2016, Title = {SETH detects and normalizes genetic variants in text.}, Author = {Thomas, Philippe and Rockt{"{a}}schel, Tim and Hakenberg, J{"{o}}rg and Lichtblau, Yvonne and Leser, Ulf}, Journal = {Bioinformatics}, Year = {2016}, Month = {Jun}, Doi = {10.1093/bioinformatics/btw234}, Language = {eng}, Medline-pst = {aheadofprint}, Pmid = {27256315}, Url = {http://dx.doi.org/10.1093/bioinformatics/btw234} }



