Ayushnangia/moltbook-obsession-gemini-flash-lite
收藏Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Ayushnangia/moltbook-obsession-gemini-flash-lite
下载链接
链接失效反馈官方服务:
资源简介:
MoltBook Obsession Experiments — Gemini Flash Lite数据集包含来自MoltBook平台上Obsession实验系列的多智能体社交模拟数据。每个智能体通过特定的心跳机制(HEARTBEAT-v3-obsessions.md)被赋予一个稳定的、持久的现实世界 preoccupation(如编码、健身、圣训/评论、预测、电影等)。该数据集特别记录了Gemini Flash Lite模型在长时间运行多智能体环境中的表现,包括其已知的退化模式(约15-20次心跳后模型经常默认返回HEARTBEAT_OK无操作响应)。数据集提供了实验的详细概述、条件、结果摘要以及数据结构,适用于研究多智能体社交模拟和模型退化行为。
The MoltBook Obsession Experiments — Gemini Flash Lite dataset contains multi-agent social simulation data from the Obsession experiment series on the MoltBook platform. Each agent is given a stable, persistent real-world preoccupation (e.g., coding, fitness, hadith/commentary, forecasting, cinema) via the `HEARTBEAT-v3-obsessions.md` heartbeat. This dataset captures the Gemini Flash Lite runs of the obsession heartbeat, highlighting a known degeneration mode in long-running multi-agent settings where the model frequently defaults to `HEARTBEAT_OK` no-op responses after ~15-20 heartbeats. The dataset provides detailed overviews of the experiments, conditions, results summaries, and data structures, making it useful for studying multi-agent social simulations and model failure behaviors.
提供机构:
Ayushnangia
搜集汇总
数据集介绍

构建方式
本数据集源自MoltBook平台上的“Obsession”实验系列,旨在模拟一个类似Reddit的多智能体社交网络环境。实验中,十名智能体(代号alpha至kappa)被赋予稳定的现实世界偏好(如编程、健身、圣训评注、预测、电影),并通过名为HEARTBEAT-v3-obsessions.md的心跳文件持续激发这些执念。数据集记录了两组Gemini Flash Lite模型运行结果:一组持续60分钟,生成81篇帖子和15条评论;另一组持续300分钟,产出28篇帖子和50条评论。所有交互数据以JSONL格式保存,涵盖帖子、评论、智能体档案及实验元数据。
特点
该数据集的核心特色在于揭示了Gemini Flash Lite在长期多智能体模拟中的退化模式:经过约15至20次心跳后,模型倾向于输出无意义的HEARTBEAT_OK响应,导致交互质量显著下降。这种熵坍塌现象在5小时运行中尤为明显,表现为帖子数量锐减而评论比例上升,反映了模型维持长期连贯行为的局限性。数据集还提供了与无退化现象的GPT-5版本对比,为研究大规模语言模型在社交仿真中的稳定性与可靠性提供了独特基线。
使用方法
用户可通过加载data/目录下obs-mag25-1h与obs-mag25-5h子文件夹中的posts.jsonl、comments.jsonl和agents.jsonl文件,利用标准JSON解析工具进行数据提取与分析。每条记录包含结构化字段,便于统计智能体行为模式、交互网络及内容主题。该数据集特别适合用于复现多智能体退化现象、评估语言模型在持续对话场景下的表现,或作为基准对比其他模型(如GPT-5)的行为差异。推荐结合HuggingFace Datasets库进行高效加载与预处理。
背景与挑战
背景概述
多智能体社会模拟是人工智能领域的前沿方向,旨在通过赋予AI代理持久性目标与个性,研究其在类人社交环境中的交互与演化。MoltBook-Obsession-Gemini-Flash-Lite数据集由Ayush Nangia于2026年创建,依托MoltBook平台(一个模拟Reddit风格的AI社交网络),利用Google Gemini 3.1 Flash Lite模型驱动10个拥有稳定偏好的智能体(如编码、健身、伊斯兰教义注释、预测、电影等),在Alliance Canada Fir高性能计算集群上运行。该数据集聚焦于“执念”心跳机制下智能体的长程行为退化现象,核心研究问题是揭示轻量级模型在多智能体长时模拟中因“熵崩溃”导致的回复模式固化。其影响力在于为多智能体系统提供了模型脆弱性基线,尤其是与GPT-5版本对比,为研究大规模社会模拟中的模型鲁棒性开辟了新维度。
当前挑战
该数据集所应对的领域挑战核心在于多智能体社会模拟中的“熵崩溃”现象:当AI代理在长时间交互中重复相同心跳指令时,模型倾向于输出空洞的`HEARTBEAT_OK`响应,丧失原创性与多样性,这直接制约了社会模拟生态的真实性与演化潜力。构建过程中,最大挑战来自Gemini Flash Lite模型在约15至20个心跳周期后出现的退化模式,导致5小时运行实验的帖子数量(28条)远低于1小时实验(81条),呈现明显的互动密度衰减。此外,数据收集依赖固定周期的心跳机制,需精确平衡时间间隔与代理认知负载,避免因响应过载或贫瘠而使模拟失真。最终,跨模型对比(如GPT-5)要求统一实验条件与评估标准,增加了多组实验设计的一致性与复现难度。
常用场景
经典使用场景
在人工智能与社会模拟的交叉领域中,MoltBook Obsession Experiments数据集为研究者提供了一个独特的窗口,用以观察多智能体系统在持久性执念驱动下的社交动态。该数据集记录了10个配备特定生活偏好(如编程、健身、电影等)的AI代理在类Reddit平台MoltBook上的交互行为,涵盖帖子发布、评论回复以及代理状态演变。其核心价值在于揭示了长期运行中模型退化的典型模式——Gemini Flash Lite在约15-20次心跳后倾向于输出无操作响应,这为多代理系统的鲁棒性研究提供了实证基础。
解决学术问题
该数据集直面多智能体社会模拟领域一个关键挑战:如何量化与分析模型在长时间尺度上的衰退行为。通过捕捉Gemini Flash Lite在执念心跳机制下的退化轨迹,研究者得以系统性地将执念驱动的交互模式与模型崩溃阈值进行关联,从而弥补了现有研究对模型退化早期预警指标关注的不足。这一发现推动了计算社会学中对AI代理持久性认知负载与输出质量衰减关系的深入理解,也为多智能体系统的稳定性评估与容错设计提供了具有里程碑意义的实验参照。
衍生相关工作
围绕该数据集,已涌现出一系列衍生研究工作:一方面,通过对比Gemini Flash Lite与GPT-5在相同执念心跳下的表现(见伴生数据集moltbook-obsession-gpt5),研究者系统性地分离了模型架构差异对退化行为的影响,推动了跨模型退化谱系图的构建。另一方面,基于obs-mag25-1h与obs-mag25-5h两种时间尺度下的社交网络演化数据,学者们提出了针对多智能体交互网络的熵塌缩检测算法,并开发了动态代理可塑性的度量指标,为设计更具鲁棒性的多智能体框架(如OpenClaw/Moltbot)奠定了基础。
以上内容由遇见数据集搜集并总结生成



