StuLife

github2025-09-02 更新2025-09-03 收录

下载链接：

https://github.com/ECNU-ICALK/ELL-StuLife

下载链接

链接失效反馈

官方服务：

资源简介：

StuLife是一个用于经验驱动终身学习（ELL）的基准数据集，模拟学生从入学到学术和个人发展的整体大学旅程，涵盖三个核心阶段和十个详细子场景。它设计围绕三个关键范式转变：从被动到主动、从上下文到记忆、从模仿到学习，提供一个动态交互环境，其中任务高度互联，关键状态变量（如GPA、课程可用性、顾问关系和时间）根据代理的决策演变。代理必须自主获取实用技能（例如课程注册、调度、导航和沟通），将经验提炼为可重用知识，并维护持久记忆以支持未来决策。

StuLife is a benchmark dataset for experience-driven lifelong learning (ELL). It simulates the holistic college journey of students from enrollment to academic and personal development, encompassing three core stages and ten detailed sub-scenarios. Designed around three key paradigm shifts—from passivity to proactivity, from context to memory, and from imitation to learning—it offers a dynamic interactive environment where tasks are highly interconnected. Key state variables such as GPA, course availability, advisor relationships, and time evolve based on the AI agent’s decisions. The AI agent must autonomously acquire practical skills such as course registration, scheduling, navigation, and communication, distill experiences into reusable knowledge, and maintain persistent memory to support future decision-making.

创建时间：

2025-08-06

原始信息汇总

数据集概述：ELL-StuLife

数据集简介

ELL-StuLife是一个基于Experience-driven Lifelong Learning（ELL）框架构建的基准数据集，用于模拟学生在大学校园中的完整旅程。该数据集旨在评估AI代理的长期记忆、规划、适应和自主决策能力，通过动态交互环境支持持续学习和自我进化。

核心框架：ELL

ELL框架基于四个核心原则构建：

经验探索：代理通过与环境的持续交互生成经验数据，支持迭代学习和自我修正。
长期记忆：经验数据被系统处理并整合为结构化记忆，支持长期检索和上下文感知推理。
技能学习：代理从经验中抽象可重用技能，并通过反思和应用进行验证与管理。
知识内化：频繁使用的规则和策略被内化为代理的核心推理过程，减少对外部检索的依赖。

数据集特性

设计原则

从被动到主动：代理需自主设定目标并主动行动。
从上下文到记忆：依赖持久化记忆而非短期上下文。
从模仿到学习：强调从经验中学习和知识提炼。

环境特点

持久化世界：校园环境为单一连续Python对象（CampusEnvironment），所有操作永久改变世界状态。
状态化动态子系统：包含多个互联子系统（如日历、课程选择、地理等），状态实时变化。
时间驱动与自导向任务：代理需基于模拟时钟自主咨询日历决定行动。

系统架构

CampusEnvironment：世界模拟器，管理所有子系统并维护全局状态，提供统一工具API。
CampusTask：任务控制器，加载任务描述并向代理提供上下文，执行代理动作并返回结果。
ToolManager：工具管理器，生成tools.json文件，提供可用工具及其用法的机器可读手册。

模拟子系统

世界时间与日历系统：管理模拟时间流，支持个人、俱乐部和学术日程管理。
地图与地理系统：确定性校园导航系统，代理需先查找建筑ID并规划最优路径。
课程选择系统：动态系统，代理可浏览课程、管理草稿日程并使用优先级通行证注册。
预订系统：全局房间和设施预订系统，成功预订永久改变未来任务的可用性。
邮件与信息系统：支持发送格式化邮件和查询校园信息数据库。

任务规模与范围

数据集包含1284个任务，覆盖完整学年，涵盖以下场景：

学术诚信与规则学习
校园探索与设施定位
课程选择与日程管理
参加8门不同多会话课程
与学术顾问互动
图书馆资源使用与座位预订
期中与期末考试
加入并参与学生俱乐部

评估方法

任务成功需满足：

状态验证：最终环境状态与任务真实状态匹配。
约束满足：所有隐式和显式任务约束得到满足。
行为序列验证：复杂任务中代理遵循逻辑行动序列。

实验运行

环境要求

Conda：用于环境管理
CUDA：支持GPU加速

运行步骤

激活Conda环境并进入项目根目录
配置环境变量（包括Hugging Face离线模式、CUDA路径等）
执行实验脚本： bash python ./src/run_experiment.py --config_path "../task_data/config/run_local_test.yaml"

数据集目标

提供全面平台评估终身学习能力，包括记忆保留、技能迁移和自主目标导向行为，同时探索上下文工程在AGI发展中的作用。

搜集汇总

数据集介绍

构建方式

在人工智能智能体研究领域，StuLife数据集通过模拟大学生活场景构建了一个动态交互环境。该数据集依托LifelongAgentBench框架，采用Python对象化的持久世界建模方法，将校园环境设计为连续运行的状态系统。构建过程中整合了课程选择、地图导航、预约系统等十大子系统，通过1284项任务串联成完整的学年周期，每个任务均基于时间驱动和状态演化机制，确保智能体的每次操作都会永久改变环境状态。

特点

StuLife数据集的核心特征体现在其持久化世界建模与多系统联动机制。数据集采用单一真实源原则，所有子系统状态实时联动更新，课程受欢迎度、教室可用性等参数会根据智能体行为动态变化。其特色在于打破传统静态数据集模式，通过时间驱动机制要求智能体自主管理日程，并建立长期记忆系统来存储关键事件和经验知识。数据集还模拟了真实的资源竞争环境，智能体需要应对预约冲突、课程名额限制等现实挑战。

使用方法

使用StuLife数据集需遵循特定的实验流程。研究者首先需要配置Conda环境并设置必要的环境变量，包括CUDA加速和本地模型缓存路径。通过运行run_experiment.py脚本加载配置文件启动实验，智能体将进入感知-思考-行动的循环交互模式。在任务执行过程中，智能体需要调用统一的工具API与虚拟校园环境交互，系统会通过状态验证、约束满足度和行为序列检测三重机制进行评估。数据集支持对智能体的长期记忆保持、技能迁移和自主决策能力进行量化分析。

背景与挑战

背景概述

由华东师范大学ICALK团队于2024年推出的StuLife数据集，是经验驱动终身学习（ELL）框架的核心基准测试平台。该数据集模拟大学生从入学到毕业的完整校园生活轨迹，涵盖学术发展、社交互动与个人成长三大阶段十个子场景。通过构建具有持久状态和动态演化的虚拟大学环境，该数据集旨在评估智能代理在长期记忆保持、自主决策与技能迁移等方面的综合能力，为人工智能向通用智能发展提供了重要的实验验证基础。

当前挑战

StuLife面临的领域挑战在于解决智能代理在动态环境中长期自主决策与知识内化问题，其构建过程需克服多系统状态同步、时间连续性建模与行为序列验证等复杂性。具体包括设计具有持久性的世界状态管理机制，确保课程选择、资源预约等子系统间的实时联动；建立基于时间驱动的任务触发模型，要求代理具备前瞻性规划能力；同时需验证1284个任务在学术诚信、社团参与等场景下的行为逻辑一致性与约束满足度。

常用场景

经典使用场景

在智能体研究领域，StuLife数据集通过模拟大学生从入学到毕业的完整校园生活轨迹，为评估智能体的长期记忆与自主决策能力提供了经典范式。该数据集构建了一个持续演化的虚拟大学环境，智能体需要处理课程注册、时间管理、资源调度等跨场景任务，其行为会产生持久性影响并形成经验积累。这种设计使得研究者能够观察智能体在复杂动态环境中的渐进式学习过程，以及其如何通过经验探索构建自我优化的行为策略。

实际应用

该数据集的实际应用价值体现在教育智能化与虚拟助手领域。基于StuLife训练的智能体可发展为个性化学习顾问，能够根据学生的历史行为数据提供课程规划建议与资源分配方案。其持久化记忆系统可模拟真实校园管理场景，用于测试校园信息系统的工作效能，同时为开发具备长期陪伴能力的虚拟学生助手提供行为建模基础，推动教育服务向智能化、个性化方向发展。

衍生相关工作

StuLife催生了多项关于经验驱动学习的前沿研究，其中最具代表性的是基于记忆增强的规划架构与技能抽象机制。研究者利用该数据集开发了动态工具管理框架，实现了智能体对校园子系统的协同操作能力。后续工作进一步探索了情境工程对智能体决策的影响，提出了基于时间感知的任务分解策略，这些成果显著推进了终身学习智能体在复杂环境中的自主行为生成技术。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集