Pubmed
收藏魔搭社区2025-05-29 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Pubmed
下载链接
链接失效反馈官方服务:
资源简介:
displayName: Pubmed
labelTypes:
- Classification
license:
- Pubmed Custom
mediaTypes:
- Text
paperUrl: https://briangallagher.net/pubs/sen-ai-2008.pdf
publishDate: "2008"
publishUrl: https://pubmed.ncbi.nlm.nih.gov/download/
publisher:
- University of Maryland
tags:
- Text
taskTypes:
- Node Classification
- Link Prediction
- Text Summarization/Simplication
- Graph-Classification
- Graph-Clustering
- Sentence-Classification
- Node-Custering
---
# 数据集介绍
## 简介
Pubmed 数据集包含来自 PubMed 数据库的 19717 篇与糖尿病相关的科学出版物,分为三类之一。引文网络由 44338 个链接组成。数据集中的每个出版物都由字典中的 TF/IDF 加权词向量描述,该字典由 500 个唯一词组成。
## 引文
```
@inproceedings{Namata2012QuerydrivenAS,
title={Query-driven Active Surveying for Collective Classification},
author={Galileo Namata and Ben London and Lise Getoor and Bert Huang},
year={2012}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: 显示名称:PubMed
labelTypes:
- 分类
license:
- PubMed 专有许可(Pubmed Custom)
mediaTypes:
- 文本
paperUrl: https://briangallagher.net/pubs/sen-ai-2008.pdf
publishDate: "2008"
publishUrl: https://pubmed.ncbi.nlm.nih.gov/download/
publisher:
- 马里兰大学(University of Maryland)
tags:
- 文本
taskTypes:
- 节点分类(Node Classification)
- 链路预测(Link Prediction)
- 文本摘要/简化(Text Summarization/Simplication)
- 图分类(Graph-Classification)
- 图聚类(Graph-Clustering)
- 句子分类(Sentence-Classification)
- 节点聚类(Node-Clustering)
---
# 数据集介绍
## 简介
PubMed 数据集包含来自 PubMed 数据库的 19717 篇糖尿病相关学术出版物,每篇均可归为三大类别之一。其引文网络共包含44338条链接。数据集中的每篇出版物均由词频-逆文档频率(TF-IDF)加权词向量表征,该向量基于包含500个唯一词汇的词典生成。
## 引文
@inproceedings{Namata2012QuerydrivenAS,
title={面向集体分类的查询驱动主动探查},
author={Galileo Namata and Ben London and Lise Getoor and Bert Huang},
year={2012}
}
## 下载数据集
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-16



