quizgen

Hugging Face2024-10-29 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/rockship/quizgen

下载链接

链接失效反馈

官方服务：

资源简介：

Quizgen LLM数据集是一个专门为训练和测试大型语言模型（LLMs）在测验生成和基于代理的工作流程中设计的问答对集合。该数据集包含494个样本，来源于三个主要类别：AWS测验样本、Langfuse工作流程样本和增强训练样本。每个样本包含一个问题、一个答案、样本来源和额外的上下文信息。数据集以JSON格式组织，旨在用于训练、微调和评估LLMs在测验相关任务中的应用。它特别适用于开发自适应测验生成器和测试基于代理的工作流程。

The Quizgen LLM Dataset is a curated collection of question-answer pairs specifically designed for training, fine-tuning and evaluating large language models (LLMs) in quiz generation and agent-based workflows. This dataset consists of 494 samples sourced from three primary categories: AWS quiz samples, Langfuse workflow samples, and augmented training samples. Each sample contains a question, an answer, the sample's source, and additional contextual information. Organized in JSON format, the dataset is intended for use in training, fine-tuning and evaluating LLMs on quiz-related tasks, and is particularly well-suited for developing adaptive quiz generators and testing agent-based workflows.

创建时间：

2024-10-29

原始信息汇总

Quizgen LLM Dataset

数据集概述

Quizgen LLM Dataset 是一个经过精心策划和合成的问答样本集合，旨在促进大型语言模型（LLMs）的训练和测试，特别是针对测验生成和基于代理的工作流程。

数据集组成

该数据集包含 494 个样本，分为以下三个主要来源：

AWS Quiz Samples: 391 个合成样本，使用 GPT-4o-mini 模型生成。
Langfuse Workflow Samples: 89 个样本，使用 Quizgen 代理工作流程生成，主要由 OpenAI-4o 驱动。
Augmented Training Samples: 14 个样本，在训练和测试过程中创建，并重新整合到数据集中以提供额外的深度。

每个样本包含问题和答案对，以及捕获来源和上下文的元数据。

数据集结构

数据集以 .json 格式存储，每个样本表示为一个字典，包含以下字段：

Question: 主要问题提示。
Answer: 预期或模型生成的答案。
Source: 样本的来源（AWS Quiz、Langfuse Workflow 或 Augmented Sample）。
Context: 在创建过程中生成的合成上下文，用于需要额外信息或背景的问题。

示例样本条目： json { "question": "What is the primary use of Amazon EC2?", "answer": "Amazon EC2 provides scalable computing capacity in the cloud.", "source": "AWS Quiz", "context": "Generated by GPT-4o-mini to simulate an AWS quiz environment." }

数据生成来源

1. AWS Quiz Samples (391 个样本)

这些样本是合成生成的，以模拟真实的 AWS 测验问题和答案。每个样本的问题和答案对由 GPT-4o-mini 生成，以复制 AWS 认证测验中的风格、内容和复杂性。问题涵盖 AWS 服务的范围、云基础知识和最佳实践，提供真实的测验体验。

2. Langfuse Workflow Samples (89 个样本)

Langfuse 样本是在 Quizgen 代理工作流程的开发阶段收集的。该工作流程涉及一个代理协调 LLM 调用，主要模型为 OpenAI-4o。这些样本更具动态性和交互性，问题提示根据实时用户输入进行调整。该集合对于测试测验生成任务中的代理工作流程特别有用，特别是在上下文和响应变化至关重要的场景中。

3. Augmented Training Samples (14 个样本)

该子集包括在 Quizgen LLM 的初始训练和测试阶段创建的额外样本。这些样本被重新整合到数据集中，以提供更广泛的问题类型和答案，丰富数据集处理复杂、细微查询的能力。它们还提供了标准测验样本可能未涵盖的边缘案例和场景的额外示例。

使用和应用

Quizgen LLM Dataset 旨在用于训练、微调和评估 LLMs 和代理架构，以生成测验。潜在应用包括：

训练和微调: 使用数据集优化 LLMs 以生成准确、上下文相关的测验问题和答案。
测试和评估: 在教育或认证相关背景下，评估模型在各种测验相关指标（如准确性、相关性和一致性）上的性能。
代理工作流程开发: 支持基于代理的架构，其中模型根据用户输入和任务要求实时生成问题-答案对。这对于开发自适应测验生成器特别有益。

数据集使用建议工作流程

数据加载: 以 JSON 格式加载数据集，可以使用常见的数据科学工具和库（如 pandas、PyTorch、TensorFlow）进行处理。
预处理: 根据特定模型输入格式要求，格式化问题和答案。例如，为 LLMs 标记文本或将输入结构化为提示-响应对。
微调: 在数据集的问题-答案对上训练模型，以提高模型生成响应的准确性和上下文相关性。
评估: 使用测试分割或交叉验证，在各种维度（如准确性、响应连贯性和用户满意度）上测量性能。
与代理系统集成: 如果在代理工作流程中使用，将数据集样本集成以测试基于动态上下文变化或用户交互的实时测验生成。

许可证

Quizgen LLM Dataset 仅用于教育和研究目的。用户有责任确保在使用 OpenAI 和 AWS 数据源构建基于此数据集的商业或开源项目时遵守任何相关许可条款。

搜集汇总

数据集介绍

构建方式

Quizgen LLM数据集通过三种主要来源构建而成，涵盖了494个样本。首先，391个样本通过GPT-4o-mini模型生成，模拟了AWS认证考试中的真实题目与答案。其次，89个样本通过Langfuse工作流生成，该工作流基于OpenAI-4o模型，能够根据用户输入动态生成问题。最后，14个样本在训练和测试过程中生成，并被重新整合到数据集中，以增强其多样性和复杂性。每个样本均包含问题、答案、来源及上下文信息，确保了数据集的丰富性和实用性。

特点

Quizgen LLM数据集的特点在于其多样化的样本来源和结构化的数据格式。数据集不仅涵盖了AWS认证考试中的典型问题，还包含了通过动态工作流生成的交互式问题，能够适应不同的用户输入和上下文变化。此外，数据集中的每个样本均附带详细的元数据，包括问题来源和生成上下文，为模型训练和评估提供了丰富的背景信息。这种结构化的设计使得数据集特别适用于训练和测试大型语言模型，尤其是在生成复杂、上下文相关的问答对时表现出色。

使用方法

Quizgen LLM数据集的使用方法包括数据加载、预处理、模型微调和评估等步骤。首先，用户可以通过常见的工具和库（如pandas、PyTorch或TensorFlow）加载JSON格式的数据集。接着，根据具体模型的需求对问题和答案进行预处理，例如文本分词或构建提示-响应对。然后，利用数据集中的问答对进行模型微调，以提高生成答案的准确性和上下文相关性。最后，通过测试集或交叉验证评估模型性能，确保其在生成问答对时的表现符合预期。此外，数据集还可用于开发基于代理的工作流，支持实时生成动态问题。

背景与挑战

背景概述

Quizgen LLM数据集是一个专注于大型语言模型（LLMs）在测验生成和基于代理的工作流程中应用的数据集。该数据集由494个样本组成，主要来源于三个部分：AWS测验样本、Langfuse工作流程样本和增强训练样本。AWS测验样本通过GPT-4o-mini模型生成，模拟了真实的AWS认证测验；Langfuse工作流程样本则通过Quizgen的代理工作流程生成，主要基于OpenAI-4o模型；增强训练样本则是在训练和测试过程中生成的，用于丰富数据集的复杂性和多样性。该数据集旨在优化LLMs在生成准确、上下文相关的测验问题和答案方面的能力，并支持基于代理的架构开发。

当前挑战

Quizgen LLM数据集在解决测验生成领域的挑战时，面临多个具体问题。首先，生成高质量、多样化的测验问题和答案需要模型具备强大的上下文理解和生成能力，这对模型的训练和微调提出了较高要求。其次，数据集在构建过程中，如何确保生成的样本能够真实反映实际测验的复杂性和多样性，是一个重要的技术难题。此外，基于代理的工作流程中，如何实现实时、动态的测验生成，并确保生成的答案与用户输入的上下文保持一致，也是一个亟待解决的挑战。这些挑战不仅考验了数据集的质量和模型的性能，也对相关领域的研究提出了新的要求。

常用场景

经典使用场景

Quizgen LLM数据集在大型语言模型（LLMs）的训练与测试中扮演着重要角色，尤其是在生成测验题目和基于代理的工作流程中。该数据集通过精心设计的问答对，帮助模型在生成测验题目时保持准确性和上下文相关性。研究人员和开发者可以利用该数据集优化模型，使其在教育和认证场景中表现出色。

衍生相关工作

Quizgen LLM数据集催生了一系列相关研究工作，特别是在基于代理的测验生成系统和自适应教育工具的开发中。许多研究利用该数据集优化了大型语言模型在生成测验题目时的表现，并探索了如何将模型与实时用户交互相结合。这些工作不仅推动了教育技术的发展，也为语言模型在更多领域的应用提供了新的思路。

数据集最近研究