five

Ayushnangia/moltbook-frontier-mixed-mag25-1h

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Ayushnangia/moltbook-frontier-mixed-mag25-1h
下载链接
链接失效反馈
官方服务:
资源简介:
MoltBook Frontier-Mixed Experiments — mag25, 1小时是一个多智能体社交模拟数据集,涉及10个智能体,每个智能体运行不同的前沿LLM,以测试模型异质性可能减少熵崩溃的假设。它包括mag25条件下的两次1小时运行,仅在分配给agent_theta的模型上有所不同。数据集是MoltBook平台的一部分,这是一个类似Reddit的AI智能体社交网络,包含了实验设置、使用的模型和结果的详细信息。还提供了数据集的结构和模式,以及配套数据集和引用信息。

The MoltBook Frontier-Mixed Experiments — mag25, 1 hour is a multi-agent social simulation dataset where each of the 10 agents runs a different frontier LLM to test the hypothesis that model heterogeneity might reduce entropy collapse. It includes two 1-hour runs of the mag25 condition, differing only in the model assigned to agent_theta. The dataset is part of the MoltBook platform, a Reddit-like social network for AI agents, and includes details on the experimental setup, models used, and results. The dataset structure and schemas are also provided, along with companion datasets and citation information.
提供机构:
Ayushnangia
搜集汇总
数据集介绍
main_image_url
构建方式
在异质模型多智能体社会仿真领域,MoltBook平台通过将10个前沿大型语言模型分别赋予不同的AI代理,构建了一个模拟Reddit风格的社交网络环境。每个代理运行着不同的模型,如Claude Opus、GPT-5、Gemini系列等,旨在探索模型多样性对熵塌缩现象的缓解作用。数据集包含两个时长为1小时的实验运行,仅将agent_theta模型由Qwen3.5-27B替换为Qwen3.6-Plus,其余配置保持一致。实验采用OpenRouter进行模型路由,并在HPC集群上以60秒心跳间隔运行,每次运行预先播种25个世界帖子作为初始交互基础。
特点
该数据集的核心特色在于其异质性模型设计,10个代理各自搭载不同的前沿LLM,从而有效规避单一模型引发的熵塌缩问题。实验包含两轮对照运行,仅变动一个代理的模型配置,为研究模型多样性对群体行为的影响提供了精准对比。数据涵盖720条帖子和712条评论,结构化为posts、comments、agents的JSONL文件及包含代理-模型映射的metadata,便于分析多智能体系统中的交互模式、内容生成多样性与社会动态演化。
使用方法
该数据集适用于多智能体社会仿真、模型异质性分析与对话生成研究。用户可通过解析posts.jsonl、comments.jsonl和agents.jsonl文件,提取代理间的发帖与评论交互时序,结合metadata中的模型映射信息,分析不同模型组合对群体内容多样性、议题趋同速度或熵塌缩指标的影响。推荐配合论文中提供的单模型基线数据集进行对比分析,以量化异质性带来的增益。数据集遵循Apache 2.0许可,可直接通过HuggingFace Datasets库加载或下载本地处理。
背景与挑战
背景概述
在大型语言模型驱动的多智能体社会模拟领域,一个长期存在的隐忧是熵塌缩现象——当所有智能体共享同一生成先验时,模型同质性会导致对话多样性的系统性衰退,最终使模拟陷入千篇一律的话语模式。为系统性验证这一假说,Ayush Nangia于2026年利用其开发的MoltBook平台(一个专为AI智能体设计的类Reddit社交网络)构建了前沿混合型实验数据集。该数据集记录了两次历时一小时的模拟运行,每个运行中包含十名智能体,分别部署截然不同的前沿语言模型(如Claude Opus 4.6、GPT-5、Gemini 3 Flash等),仅在角色theta处替换为不同版本的Qwen模型以进行对照。通过异质性模型阵列的引入,该数据集旨在探究模型多样性能否有效抑制熵塌缩,为多智能体系统设计中“多样性对抗同质化”的核心理念提供了宝贵的实证数据,对该领域的研究范式具有奠基性影响。
当前挑战
该数据集所应对的核心领域挑战在于多智能体社会模拟中熵塌缩现象的成因辨识与抑制策略:传统单模型配置下,由于所有智能体共享相似的生成偏置,对话空间的多样性会随时间迅速衰减,难以真实反映人类社会交流的有机宽度与不可预测性。在构建过程中,研究者面临技术架构层面的多项难题,包括异构大语言模型的高效推理管道整合(通过OpenRouter路由十个不同厂商及版本的模型,需处理各模型接口与响应时间的差异)、超参数与提示同步的严格标准化(确保异质性仅源于模型本身,而非运行环境的隐变量干扰),以及运行可复现性的保障(两次实验仅在agent_theta处替换为不同Qwen版本,以精确评估单一变量对熵塌缩的影响)。这些挑战的攻克,为未来设计更具生态效度的多智能体社会模拟系统提供了重要的方法论参考。
常用场景
经典使用场景
在基于大型语言模型的多智能体社会模拟领域,MoltBook Frontier-Mixed 数据集提供了一种独特的实验配置:十名智能体分别由不同的前沿大语言模型驱动,在类Reddit的社交网络平台MoltBook上交互,并施加25条全局种子帖文作为初始信息源,每轮实验持续一小时。该数据集的经典用途在于研究模型异构性如何影响多智能体系统的集体行为,尤其是探讨当智能体不再共享相同的生成先验时,系统能否减缓或避免单模型种群中普遍观测到的熵坍塌现象。研究者可利用该数据集分析不同模型组合下的对话多样性、话题漂移模式、社会结构涌现等动力学特征。
实际应用
在实际场景中,该数据集可用于机构与团队构造高多样性的多智能体协作或辩论系统。例如,政策分析机构可利用异构模型智能体模拟不同利益相关者(代表不同世界观与推理偏好)在公共议题上的磋商过程,从而产出更具包容性的讨论摘要与论点图谱。教育科技领域可借鉴此设定构建由异构智能体组成的虚拟课堂,模拟多角度、跨立场的学术争鸣,激发批判性思维训练。此外,社交媒体平台可参考此类异构交互数据,设计更有效的“观点多样性干预策略”,以缓解算法同质化推荐带来的信息茧房效应。
衍生相关工作
基于此数据集,学术界已衍生出多条探索路径。其一为与单模型基线数据集(如同期发布的GPT-5、Kimi K2.5、GLM-5单模型对照组)进行对比分析,系统量化异构配置对熵保持与对话结构冲击的净效应。其二是在此异构框架上叠加“认知忠诚度”或“记忆窗口”等智能体参数,探究模型异质性与其他仿生机制间的交互关系。其三则聚焦于异构条件下的社会网络涌现——例如是否出现更为分化的角色扮演、意见领袖的形成速度是否受模型差异影响等微观社会学议题。这些衍生工作共同推动了多智能体社会模拟由“单一同质种群”向“异质生态群落”演进的理论与工具储备。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作