travis0103/abstract_paper_review
收藏Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/travis0103/abstract_paper_review
下载链接
链接失效反馈官方服务:
资源简介:
Abstract Paper Reviews数据集旨在训练机器学习模型,基于学术论文的标题和摘要生成评论。数据集以对话风格格式化,便于直接使用,无需额外的解析或转换为聊天模板。数据集中的文本主要为英文,包含训练和测试数据集的大小分别为12452和3113。数据集来源于OpenReview,评论由GPT-4生成,综合了多个人类撰写的评论,以确保评论内容的全面性和一致性。
Abstract Paper Reviews数据集旨在训练机器学习模型,基于学术论文的标题和摘要生成评论。数据集以对话风格格式化,便于直接使用,无需额外的解析或转换为聊天模板。数据集中的文本主要为英文,包含训练和测试数据集的大小分别为12452和3113。数据集来源于OpenReview,评论由GPT-4生成,综合了多个人类撰写的评论,以确保评论内容的全面性和一致性。
提供机构:
travis0103
原始信息汇总
数据集概述
基本信息
- 任务类别:text2text-generation
- 语言:英语(en)
- 数据集名称:Open Reviews Summary on ML Papers Abstract
- 数据集大小:10,000 < n < 100,000
数据集描述
- 目的:用于训练机器学习模型生成学术论文的评论,基于论文的标题和摘要。
- 格式:采用对话式风格,可直接与SFTTrainer等模型配合使用,无需额外解析或转换为聊天模板。
- 应用:开发能够协助同行评审过程的模型,提供学术论文的初步反馈。
数据集内容
- 语言:主要为英语。
- 示例结构:
- 系统角色提供评审标准和要求。
- 用户角色提供论文标题和摘要。
- 助手角色根据评审标准提供详细的评审反馈。
数据集大小
- 训练集:12,452条记录
- 测试集:3,113条记录
数据集来源
- 数据源:OpenReview
- 数据处理:使用GPT-4生成每篇论文的评论摘要,综合多个人类评审的见解,确保评论内容的全面性和一致性。
数据集用途
- 目的:为训练模型提供专业工具,生成对学术论文的建设性反馈,特别是在机器学习领域。
- 应用:自动化同行评审过程的部分环节,协助研究人员在提交前改进其工作。



