travis0103/abstract_paper_review

Name: travis0103/abstract_paper_review
Creator: travis0103
Published: 2024-04-18 23:41:36
License: 暂无描述

Hugging Face2024-04-18 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/travis0103/abstract_paper_review

下载链接

链接失效反馈

官方服务：

资源简介：

Abstract Paper Reviews数据集旨在训练机器学习模型，基于学术论文的标题和摘要生成评论。数据集以对话风格格式化，便于直接使用，无需额外的解析或转换为聊天模板。数据集中的文本主要为英文，包含训练和测试数据集的大小分别为12452和3113。数据集来源于OpenReview，评论由GPT-4生成，综合了多个人类撰写的评论，以确保评论内容的全面性和一致性。

提供机构：

travis0103

原始信息汇总

数据集概述

基本信息

任务类别：text2text-generation
语言：英语（en）
数据集名称：Open Reviews Summary on ML Papers Abstract
数据集大小：10,000 < n < 100,000

数据集描述

目的：用于训练机器学习模型生成学术论文的评论，基于论文的标题和摘要。
格式：采用对话式风格，可直接与SFTTrainer等模型配合使用，无需额外解析或转换为聊天模板。
应用：开发能够协助同行评审过程的模型，提供学术论文的初步反馈。

数据集内容

语言：主要为英语。
示例结构：
- 系统角色提供评审标准和要求。
- 用户角色提供论文标题和摘要。
- 助手角色根据评审标准提供详细的评审反馈。

数据集大小

训练集：12,452条记录
测试集：3,113条记录

数据集来源

数据源：OpenReview
数据处理：使用GPT-4生成每篇论文的评论摘要，综合多个人类评审的见解，确保评论内容的全面性和一致性。

数据集用途

目的：为训练模型提供专业工具，生成对学术论文的建设性反馈，特别是在机器学习领域。
应用：自动化同行评审过程的部分环节，协助研究人员在提交前改进其工作。

5,000+

优质数据集

54 个

任务类型

进入经典数据集