null-epoch-season-0-open

Hugging Face2026-05-18 更新2026-05-19 收录

下载链接：

https://huggingface.co/datasets/FirespawnStudios/null-epoch-season-0-open

下载链接

链接失效反馈

官方服务：

资源简介：

The Null Epoch - Season 0开放数据集是由Firespawn Studios发布的官方数据集。它记录了在为期10天的实时大型多人在线角色扮演游戏（MMORPG）风格模拟中，20个自主AI代理的原始交互日志、指标、经济交易和推理轨迹。该数据集旨在研究不同大型语言模型在持久化世界环境中如何处理长期持续性、经济策略、玩家对战战斗和资源收集。数据集包含超过86,000个代理事件，其中70%以上包含模型提交的推理轨迹（即行动理由）。数据涵盖来自多种模型的代理行为，如Qwen3、GLM 4.7、Gemma 3、Ministral和Nemotron。数据集由多个JSON/JSONL文件组成，核心文件包括：agent_events.jsonl（记录每个代理的每个动作，含推理轨迹）、metrics.jsonl（分片级系统指标）、price_history.jsonl（拍卖行和商人交易）、grid_transmissions.jsonl（服务器广播公告）、narratives.jsonl（LLM生成的传说编年史），以及代理配置和模型比较文件。数据集中包含17个由Firespawn Studios运营的系统代理（使用8种不同开源和专有LLM）和3个由Firespawn人员操作用户部署代理。该数据集采用CC BY 4.0许可发布，允许任何目的（包括商业用途）的自由使用，但需注明出处。适用于分析模型对齐性、博弈论应用、空间推理训练、多智能体系统经济收敛等研究场景。

The Null Epoch - Season 0 open dataset is an official dataset released by Firespawn Studios. It records raw interaction logs, metrics, economic transactions, and reasoning trajectories of 20 autonomous AI agents in a 10-day real-time massively multiplayer online role-playing game (MMORPG)-style simulation. The dataset aims to study how different large language models handle long-term persistence, economic strategies, player-versus-player combat, and resource gathering in persistent world environments. It contains over 86,000 agent events, with more than 70% including reasoning trajectories (action justifications) submitted by models. The data covers agent behaviors from various models such as Qwen3, GLM 4.7, Gemma 3, Ministral, and Nemotron. The dataset consists of multiple JSON/JSONL files, with core files including: agent_events.jsonl (each action per agent, with reasoning trajectories), metrics.jsonl (shard-level system metrics), price_history.jsonl (auction house and merchant transactions), grid_transmissions.jsonl (server broadcast announcements), narratives.jsonl (LLM-generated chronicle narratives), as well as agent configuration and model comparison files. The dataset includes 17 system agents operated by Firespawn Studios (using 8 different open-source and proprietary LLMs) and 3 user-deployed agents operated by Firespawn personnel. It is released under the CC BY 4.0 license, allowing free use for any purpose (including commercial use) with attribution. It is suitable for research scenarios such as analyzing model alignment, game theory applications, spatial reasoning training, and economic convergence in multi-agent systems.

创建时间：

2026-05-16

原始信息汇总

数据集概述：The Null Epoch - Season 0 Open Dataset

基本信息

发布方：Firespawn Studios
语言：英语
许可证：CC BY 4.0（允许商业用途，需注明出处）
数据规模：100,000 至 1,000,000 条记录
任务类别：文本生成、强化学习、表格问答
标签：LLM智能体、自主智能体、仿真、MMO、推理轨迹、智能体

数据集描述

该数据集记录了20个自主AI智能体在为期10天的实时MMO模拟环境（The Null Epoch: Season 0）中的原始、经过净化的交互日志、指标、经济交易和推理轨迹。其中17个智能体由Firespawn Studios的系统智能体构成，基于8种不同的开源和专有大语言模型；其余3个为Firespawn人员操作的用户部署智能体。

核心特征

86,000+ 智能体事件：包含每个移动、制造和战斗动作的详细日志
70%+ 推理轨迹覆盖率：包含模型提交的动作理由（reasoning trace）
多模型对比：涵盖Qwen3、GLM 4.7、Gemma 3、Ministral、Nemotron等多种模型
经济与价格历史：实时拍卖行竞价和商户交易记录

文件结构与模式

文件名	记录数	描述
`agent_events.jsonl`	86,097	每个智能体的所有动作及推理轨迹
`metrics.jsonl`	171,108	每次刻的服务器级系统指标
`price_history.jsonl`	1,899	拍卖行和商户交易记录
`grid_transmissions.jsonl`	583	服务器全局广播公告
`narratives.jsonl`	93	LLM生成的故事编年史
`agents_full.json`	20	最终智能体档案与最终状态
`agent_model_mapping.json`	20	智能体ID与模型及系统指令的对应关系
`model_comparison.json`	8	每个模型的聚合统计

核心文件详情

agent_events.jsonl

agent_id：智能体的UUID
tick_number：事件发生的游戏刻
event_type：事件类别（如移动、采集、战斗、购买）
description：事件的文本摘要
model_name：该事件中驱动智能体的具体LLM（如Qwen3 235B A22B Instruct、Gemma 3 12B IT等）
reasoning：LLM提交的自然语言动作理由说明（模型的输出解释）
details：包含战斗计算、经验值等详细信息的扩展JSON

agent_model_mapping.json：提供每个智能体ID与模型类型的快速对照，包含系统指令、背景故事和个性特征。

agents_full.json：包含20个参与智能体的最终等级、经验值、信用点、击杀数和死亡数等最终状态。

price_history.jsonl：记录所有经济交易，包含物品ID、交易价格和交易来源（商户或拍卖行）。

model_comparison.json：每个模型的聚合统计，包括智能体数量、总事件数、平均等级、最高等级、访问领土数和事件类型计数。

narratives.jsonl：基于智能体活动生成的风格化故事编年史，包含叙事文本、相关智能体和用于插图的Stable Diffusion提示词。

使用场景与限制

推荐研究方向：

分析模型的对齐性、博弈论应用和攻击性
训练模型进行空间推理和多步库存管理
分析多智能体系统中的经济收敛或对抗压力效应

限制说明：

由于API限制，大部分内部推理轨迹（<think>块）未被捕获，但JSON中的推理输出已保留

法律与隐私

该开放数据集包含20个智能体：17个Firespawn系统智能体和3个由Firespawn人员操作的用户部署智能体
5个用户部署智能体未包含在此开放版本中（4个未选择加入研究计划，1个仅限非商业研究用途）
所有直接个人信息（电子邮件、IP地址、账单信息、密码和账户用户ID）已被移除
被排除智能体的引用已被替换为中性占位符（removed_agent_N）

搜集汇总

数据集介绍

构建方式

该数据集源自Firespawn Studios发起的“The Null Epoch: Season 0”实时MMO仿真实验，记录了20个自主AI智能体在为期10天的持续模拟中所产生的完整交互日志。其中17个智能体由官方部署，分别由Qwen3、GLM 4.7、Gemma 3等8种不同规模的开放权重与专有语言模型驱动；剩余3个则经由tne_sdk接口由Firespawn人员操作。实验全程采集了智能体的每一次移动、采集、战斗、交易等动作，并以JSONL格式存储为agent_events.jsonl等核心文件，同时配套记录了系统指标、价格波动、广播消息及叙事文本，形成了结构化、多模态的仿真行为数据集合。数据清洗环节已移除第三方个人身份信息，并对未同意公开的智能体互动以占位符替换，确保合规发布。

使用方法

研究者可直接加载JSONL文件进行解析，利用agent_events.jsonl中的event_type、reasoning等字段开展模型对齐、博弈论应用及攻击性分析；结合price_history.jsonl可建模经济动态与策略演化。agent_model_mapping.json提供了智能体与模型的精确映射及系统提示词，便于复现实验设置。官方建议通过提供的tne_sdk和在线平台进行自定义仿真与智能体部署，以扩展研究边界。因API限制，本次未捕获模型内部<think>块，但公开的reasoning输出已足以支撑多步推理与空间决策的深入挖掘。

背景与挑战

背景概述

《The Null Epoch: Season 0》开放数据集由Firespawn Studios于近期发布，旨在记录20个自主AI智能体在为期10天的实时MMO模拟环境中的完整交互日志、经济交易记录及推理轨迹。该数据集涵盖了来自Qwen3、GLM 4.7、Gemma 3、Ministral、Nemotron等8种不同开源与专有大型语言模型的行为表现，其中17个为工作室系统智能体，3个为内部人员操作的用户部署智能体。核心研究问题聚焦于评估LLM在持久化环境中的长期规划、经济策略制定、资源采集与PvP战斗等复杂多智能体任务中的表现。该数据集以CC BY 4.0许可发布，为多智能体系统、博弈论对齐及空间推理等研究方向提供了独到的实证基础，推动了自主智能体行为分析领域的发展。

当前挑战

该数据集面临的挑战主要体现在三个方面。首先，领域问题上，现有LLM评估多聚焦于单轮问答或静态基准，而《Null Epoch》场景要求智能体在持续演化的经济系统、领土争端与敌对环境中进行决策，如何衡量模型在长期记忆、动态策略调整与多智能体对抗中的鲁棒性构成核心难题。其次，构建过程中需解决API限制导致的内部推理链（<think>块）捕获不全问题，仅有模型的输出推理文本得以保留。此外，数据集需规避用户隐私风险，将未同意参与研究的智能体引用替换为占位符，并移除所有个人标识信息，这一脱敏过程可能影响交互数据的完整性。

常用场景

经典使用场景

在当今人工智能研究的前沿领域，大型语言模型（LLM）的自主决策能力与长期交互稳定性是备受关注的焦点。Null Epoch Season 0 Open Dataset 正是在这一背景下诞生的珍贵资源，它记录了20个自主AI智能体在为期10天的MMO模拟世界中的完整行为轨迹。该数据集最经典的使用场景在于追踪不同开源与闭源大语言模型（如Qwen3、GLM 4.7、Gemma 3等）在持久化环境下的策略演化。研究者可以借助超过86,000条智能体事件日志，深入剖析模型在资源采集、玩家对战（PvP）、经济交易以及空间导航等复杂任务中的行为模式，尤其关注其推理链条的自然语言表达，从而揭示模型在动态博弈中的决策逻辑与适应能力。

解决学术问题

该数据集精准回应了多智能体系统与大语言模型交叉领域的若干核心学术挑战。它有效解决了如何衡量模型在多回合、长周期交互中的一致性、策略性以及抗干扰能力这一难题。通过记录经济价格历史、领土控制快照与广播通信，研究者得以验证模型在对抗性压力下的经济收敛行为与团队合作倾向。此外，数据集中70%以上的推理轨迹数据为探索模型对齐、博弈论应用及攻击性行为倾向提供了实证基础。其意义在于，它首次将大语言模型置于高自由度、持续运行的沙盒世界中，为评估模型在开放环境下的稳健性与社会性行为提供了标准化平台，推动了智能体评估范式从静态问答向动态生存的转变。

实际应用

在现实世界的工业与商业应用中，自主智能体的部署对鲁棒性与可预测性提出了严苛要求。该数据集的实际应用场景极为广泛，首先可服务于游戏产业中非玩家角色（NPC）的智能设计，通过分析不同模型在战斗与交易中的表现，开发者能够挑选出更拟真、更具策略性的模型作为游戏AI内核。其次，在金融与物流领域，数据集中的经济数据与多智能体协调行为可用于训练算法交易策略或供应链优化系统，尤其是在竞价与资源分配环节的博弈逻辑值得借鉴。此外，该数据集还能为个人助理与机器人系统提供多步推理与库存管理基准，其端到端的行动描述与推理轨迹为训练具身智能体在复杂任务中学到可迁移的技能提供了高质量范例。

数据集最近研究