PubMed_Paper_Reading_Dataset
收藏魔搭社区2025-08-07 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/PubMed_Paper_Reading_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
displayName: PubMed Paper Reading Dataset
license:
- MIT
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/1905.07870v4.pdf
publishDate: "2019"
publishUrl: https://eaglew.github.io/dataset/paperrobot_reading
publisher:
- University of Washington
- University of North Carolina at Chapel Hill
- Rensselaer Polytechnic Institute
- University of Illinois Urbana-Champaign
- DiDi Labs
tags:
- Text
taskTypes:
- Link Prediction
- Paper Generation
---
# 数据集介绍
## 简介
该数据集从 PubMed 收集了 14,857 个实体、133 个关系以及对应于标记化文本的实体。它包含 875,698 个训练对、109,462 个开发对和 109,462 个测试对。
## 引文
```
@article{wang2019paperrobot,
title={Paperrobot: Incremental draft generation of scientific ideas},
author={Wang, Qingyun and Huang, Lifu and Jiang, Zhiying and Knight, Kevin and Ji, Heng and Bansal, Mohit and Luan, Yi},
journal={arXiv preprint arXiv:1905.07870},
year={2019}
}
```
## Download dataset
:modelscope-code[]{type="git"}
数据集名称:PubMed 论文阅读数据集(PubMed Paper Reading Dataset)
许可证:MIT 许可证
媒体类型:文本
论文链接:https://arxiv.org/pdf/1905.07870v4.pdf
发布日期:2019年
发布页面链接:https://eaglew.github.io/dataset/paperrobot_reading
发布机构:华盛顿大学、北卡罗来纳大学教堂山分校、伦斯勒理工学院、伊利诺伊大学厄巴纳-香槟分校、滴滴实验室(DiDi Labs)
标签:文本
任务类型:链接预测(Link Prediction)、论文生成(Paper Generation)
---
# 数据集介绍
## 简介
本数据集从PubMed收集了14,857个实体、133种关系以及与标记化文本对应的实体集,共包含875,698个训练样本对、109,462个开发样本对与109,462个测试样本对。
## 引文
@article{wang2019paperrobot,
title={科学构想的增量草稿生成(Incremental draft generation of scientific ideas)},
author={Wang, Qingyun and Huang, Lifu and Jiang, Zhiying and Knight, Kevin and Ji, Heng and Bansal, Mohit and Luan, Yi},
journal={arXiv 预印本 arXiv:1905.07870},
year={2019}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02



