quizgen
收藏Quizgen LLM Dataset
数据集概述
Quizgen LLM Dataset 是一个经过精心策划和合成的问答样本集合,旨在促进大型语言模型(LLMs)的训练和测试,特别是针对测验生成和基于代理的工作流程。
数据集组成
该数据集包含 494 个样本,分为以下三个主要来源:
- AWS Quiz Samples: 391 个合成样本,使用
GPT-4o-mini模型生成。 - Langfuse Workflow Samples: 89 个样本,使用
Quizgen代理工作流程生成,主要由OpenAI-4o驱动。 - Augmented Training Samples: 14 个样本,在训练和测试过程中创建,并重新整合到数据集中以提供额外的深度。
每个样本包含问题和答案对,以及捕获来源和上下文的元数据。
数据集结构
数据集以 .json 格式存储,每个样本表示为一个字典,包含以下字段:
- Question: 主要问题提示。
- Answer: 预期或模型生成的答案。
- Source: 样本的来源(
AWS Quiz、Langfuse Workflow或Augmented Sample)。 - Context: 在创建过程中生成的合成上下文,用于需要额外信息或背景的问题。
示例样本条目: json { "question": "What is the primary use of Amazon EC2?", "answer": "Amazon EC2 provides scalable computing capacity in the cloud.", "source": "AWS Quiz", "context": "Generated by GPT-4o-mini to simulate an AWS quiz environment." }
数据生成来源
1. AWS Quiz Samples (391 个样本)
这些样本是合成生成的,以模拟真实的 AWS 测验问题和答案。每个样本的问题和答案对由 GPT-4o-mini 生成,以复制 AWS 认证测验中的风格、内容和复杂性。问题涵盖 AWS 服务的范围、云基础知识和最佳实践,提供真实的测验体验。
2. Langfuse Workflow Samples (89 个样本)
Langfuse 样本是在 Quizgen 代理工作流程的开发阶段收集的。该工作流程涉及一个代理协调 LLM 调用,主要模型为 OpenAI-4o。这些样本更具动态性和交互性,问题提示根据实时用户输入进行调整。该集合对于测试测验生成任务中的代理工作流程特别有用,特别是在上下文和响应变化至关重要的场景中。
3. Augmented Training Samples (14 个样本)
该子集包括在 Quizgen LLM 的初始训练和测试阶段创建的额外样本。这些样本被重新整合到数据集中,以提供更广泛的问题类型和答案,丰富数据集处理复杂、细微查询的能力。它们还提供了标准测验样本可能未涵盖的边缘案例和场景的额外示例。
使用和应用
Quizgen LLM Dataset 旨在用于训练、微调和评估 LLMs 和代理架构,以生成测验。潜在应用包括:
- 训练和微调: 使用数据集优化 LLMs 以生成准确、上下文相关的测验问题和答案。
- 测试和评估: 在教育或认证相关背景下,评估模型在各种测验相关指标(如准确性、相关性和一致性)上的性能。
- 代理工作流程开发: 支持基于代理的架构,其中模型根据用户输入和任务要求实时生成问题-答案对。这对于开发自适应测验生成器特别有益。
数据集使用建议工作流程
- 数据加载: 以 JSON 格式加载数据集,可以使用常见的数据科学工具和库(如
pandas、PyTorch、TensorFlow)进行处理。 - 预处理: 根据特定模型输入格式要求,格式化问题和答案。例如,为 LLMs 标记文本或将输入结构化为提示-响应对。
- 微调: 在数据集的问题-答案对上训练模型,以提高模型生成响应的准确性和上下文相关性。
- 评估: 使用测试分割或交叉验证,在各种维度(如准确性、响应连贯性和用户满意度)上测量性能。
- 与代理系统集成: 如果在代理工作流程中使用,将数据集样本集成以测试基于动态上下文变化或用户交互的实时测验生成。
许可证
Quizgen LLM Dataset 仅用于教育和研究目的。用户有责任确保在使用 OpenAI 和 AWS 数据源构建基于此数据集的商业或开源项目时遵守任何相关许可条款。




