five

travis0103/abstract_paper_review

收藏
Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/travis0103/abstract_paper_review
下载链接
链接失效反馈
官方服务:
资源简介:
Abstract Paper Reviews数据集旨在训练机器学习模型,基于学术论文的标题和摘要生成评论。数据集以对话风格格式化,便于直接使用,无需额外的解析或转换为聊天模板。数据集中的文本主要为英文,包含训练和测试数据集的大小分别为12452和3113。数据集来源于OpenReview,评论由GPT-4生成,综合了多个人类撰写的评论,以确保评论内容的全面性和一致性。

Abstract Paper Reviews数据集旨在训练机器学习模型,基于学术论文的标题和摘要生成评论。数据集以对话风格格式化,便于直接使用,无需额外的解析或转换为聊天模板。数据集中的文本主要为英文,包含训练和测试数据集的大小分别为12452和3113。数据集来源于OpenReview,评论由GPT-4生成,综合了多个人类撰写的评论,以确保评论内容的全面性和一致性。
提供机构:
travis0103
原始信息汇总

数据集概述

基本信息

  • 任务类别:text2text-generation
  • 语言:英语(en)
  • 数据集名称:Open Reviews Summary on ML Papers Abstract
  • 数据集大小:10,000 < n < 100,000

数据集描述

  • 目的:用于训练机器学习模型生成学术论文的评论,基于论文的标题和摘要。
  • 格式:采用对话式风格,可直接与SFTTrainer等模型配合使用,无需额外解析或转换为聊天模板。
  • 应用:开发能够协助同行评审过程的模型,提供学术论文的初步反馈。

数据集内容

  • 语言:主要为英语。
  • 示例结构
    • 系统角色提供评审标准和要求。
    • 用户角色提供论文标题和摘要。
    • 助手角色根据评审标准提供详细的评审反馈。

数据集大小

  • 训练集:12,452条记录
  • 测试集:3,113条记录

数据集来源

  • 数据源:OpenReview
  • 数据处理:使用GPT-4生成每篇论文的评论摘要,综合多个人类评审的见解,确保评论内容的全面性和一致性。

数据集用途

  • 目的:为训练模型提供专业工具,生成对学术论文的建设性反馈,特别是在机器学习领域。
  • 应用:自动化同行评审过程的部分环节,协助研究人员在提交前改进其工作。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作