scenarios

Hugging Face2026-01-09 更新2026-01-10 收录

下载链接：

https://huggingface.co/datasets/upstage-isd-agent/scenarios

下载链接

链接失效反馈

官方服务：

资源简介：

ISD Agent Benchmark Scenarios是一个用于教学系统设计(Instructional Systems Design)AI代理评估的基准场景数据集。该数据集包含25,795个场景，其中8,842个为IDLD对齐场景，16,953个为上下文变体场景。数据集支持韩语和英语，覆盖了多种年龄层(10代~40代以上)、学习者规模(小规模~大规模)、传递方式(线下~在线实时~在线异步等)、机构类型(中小学~大学~企业等)和领域分类(语言~数学~科学~社会等)。数据集采用Apache 2.0许可证，可用于文本生成任务。

创建时间：

2026-01-08

原始信息汇总

ISD Agent Benchmark Scenarios 数据集概述

数据集基本信息

名称：ISD Agent Benchmark Scenarios
主要用途：用于教学系统设计（Instructional Systems Design）AI代理评估的基准测试场景数据集。
支持语言：韩语（ko）、英语（en）
许可协议：Apache 2.0
任务类别：文本生成（text-generation）
标签：教学系统设计（instructional-design）、教育（education）、基准测试（benchmark）、ISD、ADDIE
数据规模：10K < n < 100K

数据规模与构成

总场景数：25,795个
- IDLD 对齐场景：8,842个
- 上下文变体场景：16,953个

数据结构

数据集文件结构如下：

scenarios/ ├── idld_aligned/ # 包含8,842个场景 │ └── scenario_idld_*.json ├── context_variant/ # 包含16,953个场景 │ ├── part1/ # 9,000个文件 │ └── part2/ # 7,953个文件 ├── source_mapping.json # 场景-原始数据映射文件 └── IDLD.xlsx - sheet1.csv # 原始IDLD数据

上下文矩阵分布

年龄分布

年龄段	比例
10대	~20%
20대	~35%
30대	~25%
40대 이상	~20%

学习者规模分布

规模	人数	比例
小规模	1-15人	~40%
中规模	16-30人	~30%
大规模	30人以上	~30%

授课方式分布

方式	比例
线下	~25%
在线实时	~20%
在线异步	~20%
混合式	~15%
自主学习	~15%
其他（PBL、VR等）	~5%

机构类型分布

类型	比例
中小学	~20%
大学	~25%
企业	~25%
职业培训机构	~15%
公共/非营利机构	~15%

领域分类

学科领域

语言（~25%）
数学（~25%）
科学（~25%）
社会（~25%）

职业领域

软件/IT开发
AI/数据科学
医疗/护理
管理/人力资源
教育
服务/客户应对

场景数据模式

每个场景数据遵循以下JSON模式： json { "scenario_id": "IDLD-0001", "variant_type": "idld_aligned", "title": "场景标题", "context": { "target_audience": "20대 대학", "prior_knowledge": "先验知识水平", "duration": "中期课程(2-4周)", "learning_environment": "混合式", "class_size": 25, "institution_type": "大学(本科)", "additional_context": "附加上下文信息" }, "learning_goals": [ "学习目标1", "学习目标2" ], "constraints": { "budget": "medium", "resources": ["资源列表"], "accessibility": null, "language": "ko", "tech_requirements": "技术要求" }, "difficulty": "普通", "domain": "科学" }

使用方法

通过 Hugging Face Datasets 加载

python from datasets import load_dataset dataset = load_dataset("upstage-isd-agent/scenarios") scenario = dataset[train][0]

直接下载

python from huggingface_hub import snapshot_download snapshot_download( repo_id="upstage-isd-agent/scenarios", repo_type="dataset", local_dir="./scenarios" )

引用信息

如需引用本数据集，请使用以下BibTeX格式： bibtex @dataset{upstage_isd_agent_2025, title={ISD Agent Benchmark Scenarios}, author={Upstage ISD Agent Team}, year={2025}, publisher={Hugging Face}, url={https://huggingface.co/datasets/upstage-isd-agent/scenarios} }

相关链接

GitHub项目地址：https://github.com/blackdew/upstage_isd_agent

搜集汇总

数据集介绍

构建方式

在教学设计领域，数据集的构建通常需要严谨的方法论支撑。该数据集基于IDLD框架进行构建，通过两种主要方式生成：一是IDLD对齐场景，共计8,842个，严格遵循教学设计原则；二是上下文变体场景，数量达16,953个，通过调整学习者背景、环境等参数实现多样化。所有场景均以结构化JSON格式存储，并附带原始数据映射，确保了数据来源的透明性与可追溯性。

特点

该数据集在教学设计评估场景中展现出鲜明的多维特征。其覆盖了从青少年到成人的广泛年龄层，并囊括了不同规模的学习群体与多样化的教学交付模式，如在线、离线及混合式学习。数据内容横跨语言、数学、科学及社会等学科领域，同时延伸至软件开发、医疗护理等多个职业范畴，提供了丰富的上下文矩阵，为评估AI代理在复杂教育环境中的适应性奠定了坚实基础。

使用方法

对于研究人员而言，利用该数据集进行实验操作简便高效。通过Hugging Face的`datasets`库可直接加载完整数据集，便捷访问每个场景的标题、受众、学习目标等结构化信息。此外，用户亦可选择通过`huggingface_hub`工具进行本地下载，以获得原始文件进行更深入的定制化分析。该数据集支持韩语与英语，适用于跨语言的教学设计智能体基准测试与研究。

背景与挑战

背景概述

在人工智能与教育技术深度融合的背景下，针对教学系统设计（Instructional Systems Design, ISD）领域的智能体评估需求日益凸显。Upstage ISD Agent Team于2025年发布了名为“scenarios”的基准数据集，旨在为ISD AI代理的效能评估提供结构化、多样化的测试场景。该数据集包含超过2.5万个精心构建的教学设计情境，覆盖从青少年到成人的多年龄段学习者，并囊括了学校教育、企业培训、职业发展等多种机构类型与线上线下混合的教学模式。其核心研究问题聚焦于如何系统性地评估AI代理在复杂、真实的教学设计任务中的适应性与创造性，为教育人工智能的实证研究与实践应用奠定了重要基础。

当前挑战

该数据集致力于解决教学系统设计自动化领域的核心挑战，即如何让AI代理在多变的教学情境中生成符合教育学原理的个性化设计方案。具体挑战包括：处理高度异构的上下文信息，如不同年龄层、知识背景、班级规模与技术环境；平衡教学设计中的多重约束条件，如预算、资源与可访问性要求；以及确保生成方案在科学性、可行性与创新性之间的协调。在构建过程中，研究团队面临了将抽象教学设计理论（如ADDIE模型）转化为可计算、可评估的结构化数据的难题，同时需保证数据在语言（韩语与英语）、文化及教育体系间的代表性与公平性，并维持大规模情景数据在领域覆盖与逻辑一致性上的高质量标准。

常用场景

经典使用场景

在人工智能辅助教育领域，该数据集为教学系统设计（ISD）AI代理的评估提供了标准化基准。其经典使用场景集中于模拟多样化教学情境，涵盖从K-12到企业培训的广泛受众，通过结构化场景描述，支持研究者对AI代理在分析学习者特征、设定教学目标、设计教学策略及评估学习成果等完整教学设计流程中的能力进行系统性测试与比较。

衍生相关工作

围绕该数据集，已衍生出一系列聚焦于智能教学设计的经典研究工作。例如，基于其构建的基准测试推动了针对教学场景理解的预训练模型、能够遵循ADDIE等经典教学设计模型的序列决策AI代理，以及面向多语言、多领域教学任务生成的评估框架的发展。这些工作共同深化了AI与教育设计的交叉领域，为自动化、自适应教学系统的演进提供了方法论与实证支持。

数据集最近研究