ELL-StuLife

Hugging Face2025-09-08 更新2025-09-09 收录

下载链接：

https://huggingface.co/datasets/ecnu-icalk/ELL-StuLife

下载链接

链接失效反馈

官方服务：

资源简介：

ELL-StuLife是一个模拟大学生活的基准数据集，用于评估智能体的长期记忆、规划、适应性和自主决策能力。数据集提供了一个持久的、有状态的、动态的虚拟大学校园环境，智能体的行动会产生持久的影响。

创建时间：

2025-09-02

原始信息汇总

数据集概述：ELL-StuLife

数据集简介

ELL-StuLife是一个用于评估AI代理长期记忆、规划、适应和自主决策能力的基准数据集，基于Experience-driven Lifelong Learning（ELL）框架构建。该数据集模拟了一个大学生从入学到学术及个人发展的完整大学旅程，涵盖三个核心阶段和十个详细子场景。

核心框架：ELL

ELL是一个通过真实世界交互实现持续自我进化的智能体构建框架，基于四个核心原则：

1. 经验探索

代理需具备顺序分解和执行复杂长期任务的能力
任务涉及分钟到小时级别的持续交互，且奖励不可量化
通过持续自我驱动的参与生成丰富的经验数据
支持迭代学习和自我纠正

2. 长期记忆

经验数据被系统处理并整合为持久化结构化记忆
记忆包括原始观察、关键事件、学习事实、时间上下文和自我反思见解
支持长时间跨度的检索和上下文感知推理

3. 技能学习

从经验中抽象重复模式为可重用技能
技能包括决策规则、功能模块或问题解决启发式
通过反思显式构建并通过新任务应用验证

4. 知识内化

将显性离散知识转化为隐性直观理解
常用规则、模式和策略被提炼为核心推理过程
减少对外部检索或逐步反思的依赖

数据集特点

核心设计原则

从被动到主动：代理需展示内在动机，自主设定目标并采取行动
从上下文到记忆：强调持久记忆而非临时上下文
从模仿到学习：注重经验提炼和知识内化

环境特性

持久世界：校园环境是单一的连续Python对象（CampusEnvironment）
状态化动态子系统：包含多个互连的动态状态化子系统
时间驱动和自我导向任务：代理基于模拟时钟自主操作

技术架构

系统组件

CampusEnvironment：世界模拟器，管理所有子系统并维护全局状态
CampusTask：任务控制器，加载任务描述并向代理呈现
ToolManager：通过反射生成工具描述文件的实用程序

模拟子系统

世界时间和日历系统
地图和地理系统
课程选择系统
预约系统
邮件和信息系统

数据集规模与内容

任务数量：1284个任务
时间跨度：完整学年
场景覆盖：
- 学术诚信和规则学习
- 校园探索和设施定位
- 课程选择和日程管理
- 参加8门不同的多节课程
- 与学术顾问互动
- 图书馆资源使用和座位预订
- 期中期末考试
- 加入和参与学生社团

评估方法

状态验证：检查最终环境状态是否匹配任务真实情况
约束满足：验证所有隐式和显式任务约束是否满足
行为序列验证：确保复杂任务中的逻辑行动序列

实验设置

数据集运行需要以下环境配置：

Conda环境管理
CUDA工具包用于GPU加速
特定的环境变量配置（HF_HOME、CUDA_HOME等）
通过run_experiment.py脚本执行实验

GitHub项目地址：https://github.com/ECNU-ICALK/ELL-StuLife

搜集汇总

数据集介绍

构建方式

ELL-StuLife数据集构建于LifelongAgentBench框架之上，通过模拟大学生活的完整周期，构建了一个持久化、状态化且动态演进的虚拟校园环境。该数据集包含1284项任务，覆盖从入学注册到学术发展及社交活动等十个子场景，每个任务均通过Python对象CampusEnvironment实现状态持久化，确保智能体的每次操作都会永久改变环境状态。数据生成过程强调任务间的内在关联性与时间驱动的自主性，要求智能体在连续交互中积累经验并实现自我演进。

特点

该数据集的核心特征体现在其高度动态与互联的子系统设计，包括课程选择、地图导航、资源预约及邮件通信等模块，各子系统状态随智能体决策实时演变。数据集通过模拟学术年度的完整时间线，要求智能体具备长期记忆保持与跨任务技能迁移能力，同时必须展现内在动机以自主规划行动。其独特之处在于将传统静态评估转为对持续性、自发性及适应性行为的综合测评，为智能体的终身学习能力提供多维验证平台。

使用方法

使用该数据集时需通过配置Conda环境与CUDA工具链搭建实验平台，并设置离线模式的环境变量以加载本地模型。实验执行基于run_experiment.py脚本调用预定义的YAML配置文件，启动后智能体将进入感知-思考-行动的循环流程。评估机制不仅检验任务最终状态的正确性，还涵盖约束满足与行为序列合理性验证，研究者可通过分析智能体在课程管理、资源调度及社交互动等场景中的表现，系统性评估其长期记忆与自主决策能力。

背景与挑战

背景概述

在人工智能持续学习领域，华东师范大学智能计算与知识实验室于2024年推出了ELL-StuLife数据集，该数据集作为经验驱动终身学习框架的基准测试平台，聚焦于智能体在动态环境中的自主进化能力。其核心研究问题在于如何使智能体通过长期交互实现知识内化与技能抽象，突破传统静态数据学习的局限性，为构建具有人类式学习能力的通用人工智能提供重要实验基础。

当前挑战

该数据集旨在解决智能体在开放环境中长期自主学习的核心挑战，包括跨时间尺度的记忆保持、动态技能迁移以及自我导向的目标生成。构建过程中面临三大技术难点：一是需要设计具有状态持久性的复杂环境模拟系统，二是实现多子系统（课程选择、资源预约等）的实时联动与状态更新，三是建立符合真实学术场景的评估体系以验证智能体的长期行为合理性。

常用场景

经典使用场景

在智能体研究领域，ELL-StuLife数据集通过模拟大学生活的完整周期，为评估智能体的长期记忆与自主决策能力提供了经典实验场景。该数据集构建了一个动态演化的虚拟校园环境，智能体需在连续的时间线上处理学术规划、社交互动、资源管理等复杂任务，其行为会产生持久性影响。这种设计使得研究者能够观察智能体在跨场景任务中的策略迁移与经验积累过程，为终身学习机制的研究提供真实可靠的测试平台。

实际应用

在实际应用层面，ELL-StuLife为教育技术与个性化助手系统提供了重要的训练与评估基准。基于该数据集开发的智能体可应用于学术指导、校园服务自动化等场景，通过模拟真实的学生行为模式优化服务策略。其动态环境建模能力也有助于构建更智能的虚拟校园系统，为教育资源的智能化管理提供技术支撑。

衍生相关工作

该数据集衍生出多项经典研究工作，特别是在上下文工程与记忆增强架构领域。研究者基于其提出的LifelongAgentBench框架开发了多种状态感知模型，推动了时间感知决策与资源约束规划算法的发展。相关成果还促进了多模态记忆整合技术的研究，为构建具备长期交互能力的智能体系统提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集