gsm8k_multiturn

Hugging Face2024-07-07 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/euclaise/gsm8k_multiturn

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集是GSM8K的'socratic'版本，通过重新格式化为多轮对话，其中子问题由用户提出。数据集包含对话特征，每个对话包含内容和角色信息，分为训练集和测试集，适用于问答和文本生成任务，支持多轮对话和数学问题。

This dataset is the 'socratic' variant of GSM8K, which has been reformatted into multi-turn dialogues where sub-questions are posed by the user. It includes dialogue features where each dialogue contains content and role information, and is split into training and test sets. It is applicable to question answering and text generation tasks, and supports multi-turn dialogue and mathematical problem-solving tasks.

创建时间：

2024-07-07

原始信息汇总

数据集概述

数据集信息

特征:
- 名称: conversations
- 列表:
  - 名称: content
    - 数据类型: string
  - 名称: role
    - 数据类型: string
分割:
- 训练集:
  - 字节数: 5214058
  - 样本数: 7473
- 测试集:
  - 字节数: 942169
  - 样本数: 1319
下载大小: 2821690
数据集大小: 6156227

配置

配置名称: default
- 数据文件:
  - 分割: train
    - 路径: data/train-*
  - 分割: test
    - 路径: data/test-*

许可证

许可证: MIT

任务类别

问题回答
文本生成

语言

语言: en

数据集名称

名称: GSM8K Multi-turn

大小类别

大小类别: 1K<n<10K

搜集汇总

数据集介绍

构建方式

gsm8k_multiturn数据集基于经典的数学问题求解数据集GSM8K构建，采用了多轮对话的形式重新组织数据。具体而言，该数据集将GSM8K的‘苏格拉底式’版本中的子问题转化为用户与模型之间的多轮对话。在原始版本中，模型通过自我提问的方式逐步解决问题，而在本数据集中，这些子问题由用户提出，从而模拟了更加自然的交互场景。数据集的构建过程注重对话的连贯性与逻辑性，确保了每一轮对话都能有效推进问题的解决。

特点

gsm8k_multiturn数据集的核心特点在于其多轮对话结构，这种设计不仅增强了数据的交互性，还为模型提供了更丰富的上下文信息。数据集包含7473条训练样本和1319条测试样本，涵盖了广泛的数学问题类型。每条样本以对话形式呈现，包含用户提问和模型回答的交替序列，角色字段清晰标注了每一轮对话的发起者。这种结构使得数据集特别适合用于训练和评估多轮对话生成模型，尤其是在数学问题求解领域。

使用方法

使用gsm8k_multiturn数据集时，研究人员可以将其应用于多轮对话生成模型的训练与评估。数据集提供了明确的对话角色标注，便于模型学习用户与模型之间的交互模式。在训练过程中，模型需要根据上下文生成连贯且逻辑严谨的回复，逐步解决数学问题。测试集可用于评估模型在多轮对话中的表现，特别是在复杂问题求解中的能力。此外，数据集的多轮对话结构也为研究对话系统的上下文理解与推理能力提供了理想的实验平台。

背景与挑战

背景概述

GSM8K Multi-turn数据集是基于GSM8K数据集的多轮对话版本，旨在通过多轮对话形式解决数学问题。该数据集由OpenAI的研究团队于2021年推出，主要用于训练和评估模型在复杂数学推理任务中的表现。GSM8K数据集本身包含数千个小学水平的数学问题，而多轮对话版本则进一步扩展了这一任务，要求模型通过用户提出的子问题逐步推理，最终得出正确答案。这一数据集的推出为自然语言处理领域中的多轮对话系统和数学推理任务提供了重要的研究资源，推动了相关技术的发展。

当前挑战

GSM8K Multi-turn数据集面临的主要挑战包括两个方面。首先，在领域问题方面，多轮对话形式的数学推理任务要求模型不仅具备数学计算能力，还需具备上下文理解和逻辑推理能力，这对模型的综合能力提出了更高要求。其次，在数据集构建过程中，如何将单轮数学问题转化为自然流畅的多轮对话，同时确保子问题的合理性和逻辑性，是一个复杂且耗时的过程。此外，数据集的规模相对较小，可能限制了模型在更广泛场景下的泛化能力。这些挑战为研究者提供了进一步优化模型和扩展数据集的方向。

常用场景

经典使用场景

在数学问题求解领域，gsm8k_multiturn数据集被广泛用于训练和评估多轮对话模型。该数据集通过将复杂的数学问题分解为多个子问题，并以对话形式呈现，使得模型能够在逐步推理中解决复杂的数学问题。这种多轮对话的形式不仅提高了模型的理解能力，还增强了其推理过程的透明性和可解释性。

衍生相关工作

基于gsm8k_multiturn数据集，研究者们开发了多种多轮对话模型和推理框架。例如，一些研究利用该数据集训练了能够自动生成子问题并逐步推理的模型，进一步推动了多轮对话系统在复杂问题求解中的应用。这些工作不仅扩展了数据集的使用范围，还为多轮对话系统的研究提供了新的思路。

数据集最近研究