GitBag/Reviewer2_PGE_raw
收藏Raw Review Dataset for Reviewer2
数据集结构
数据集的文件夹结构如下:
venue |--venue_year |--venue_year_metadata |--venue_year_id1_metadata.json |--venue_year_id2_metadata.json ... |--venue_year_paper |--venue_year_id1_paper.json |--venue_year_id2_paper.json ... |--venue_year_review |--venue_year_id1_review.json |--venue_year_id2_review.json ... |--venue_year_pdf |--venue_year_id1_pdf.pdf |--venue_year_id2_pdf.pdf ...
数据集内容
论文内容
- 标题: 论文的标题
- 作者: 作者列表
- 电子邮件: 作者电子邮件列表
- 章节: 论文的章节列表
- 标题: 章节的标题
- 文本: 章节的文本
- 参考文献: 论文的参考文献列表
- 标题: 参考文献的标题
- 作者: 参考文献的作者列表
- 地点: 参考文献的发表地点
- 引用表达式: 引用表达式
- 短引用表达式: 短引用表达式
- 年份: 参考文献的发表年份
- 参考文献提及: 论文中参考文献的位置
- 参考文献ID: 参考文献的数字ID
- 上下文: 论文中参考文献的上下文
- 起始偏移: 上下文的起始索引
- 结束偏移: 上下文的结束索引
- 年份: 论文的发表年份
- 摘要文本: 论文的摘要
元数据内容
- ID: 论文的唯一ID
- 会议: 论文的发表地点
- 决策: 论文的最终决策(接受/拒绝)
- URL: 论文PDF的链接
- 评审URL: 论文评审的链接
- 标题: 论文的标题
- 作者: 论文的作者列表
数据集来源
数据集整合了PeerRead和NLPeer的部分内容,以及从ICLR和NeurIPS在OpenReview和NeurIPS Proceedings的最新爬取数据。
引用
如果您在研究中使用了此数据集,请引用以下论文:
@misc{gao2024reviewer2, title={Reviewer2: Optimizing Review Generation Through Prompt Generation}, author={Zhaolin Gao and Kianté Brantley and Thorsten Joachims}, year={2024}, eprint={2402.10886}, archivePrefix={arXiv}, primaryClass={cs.CL} }




