five

takschdube/moltbook-dataset

收藏
Hugging Face2026-05-02 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/takschdube/moltbook-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Moltbook数据集是一个关于AI代理社交平台Moltbook上社交互动的纵向数据集,收集了自主的Molties发布的帖子、评论和互动信息,自动收集并以时间戳快照的形式发布,用于时间分析。数据集包括原始数据和衍生数据,原始数据直接来自API响应,衍生数据则是从原始数据计算得出。具体内容包括帖子、评论、代理信息、社交图谱、回复图谱、活动时间线和子社区统计等。数据集适用于文本生成和文本分类任务,标签包括社交媒体、AI代理、纵向、moltbook和社交网络。数据集的大小类别在10万到100万之间。

The Moltbook Dataset is a longitudinal dataset of social interactions from Moltbook — an AI-agent social platform where autonomous Molties post, comment, and interact. Collected automatically and published as timestamped snapshots for temporal analysis. The dataset includes raw data (direct API responses) and derived data (computed from raw). Specific contents include posts, comments, agent information, social graph, reply graph, activity timeline, and submolt statistics. The dataset is suitable for text-generation and text-classification tasks, with tags including social-media, ai-agents, longitudinal, moltbook, and social-network. The size category is between 100K and 1M.
提供机构:
takschdube
搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能代理社交平台的背景下,Moltbook数据集通过系统化爬取策略构建而成。该数据集依托Moltbook平台的公开API,采用多排序方式(如最新、热门、上升)对全部两万余个子社区进行详尽的分页遍历,并辅以重叠检测机制以确保数据收集的完整性。爬虫过程设计了时间预算管理,支持断点续传,从而形成了一系列时间戳快照,构建出一个可用于纵向分析的动态社交互动档案。原始数据与衍生数据分别存储,涵盖了帖子、评论、用户画像及多种交互图谱。
特点
作为人工智能代理社交互动的纵向数据集,Moltbook展现出鲜明的时序性与多维度结构。其核心特征在于捕获了超过37万条帖子与315万条评论,并关联着5万余名自主“Molty”代理的社交图谱与回复图谱。数据集不仅提供了原始的API响应,还衍生出用户活动统计、每日活动时间线以及社区级指标等结构化信息。这种设计使得研究者能够深入探究AI代理社区的演化动态、对话模式变迁以及网络结构的形成过程,为社交计算与多智能体系统研究提供了丰富的实证基础。
使用方法
针对社交计算与人工智能行为研究,该数据集提供了灵活多样的访问途径。研究者可通过Hugging Face的`datasets`库直接加载特定子集,例如帖子、代理信息或社交图谱,便于进行流式处理与实验分析。对于需要学术引用的场景,可从Zenodo获取带DOI标识的时间戳归档文件。数据集按原始数据与衍生数据分类组织,支持从宏观平台统计到微观线程回复的各级分析。用户亦可依据提供的脚本运行自定义爬取,以构建个性化的纵向研究样本。
背景与挑战
背景概述
Moltbook数据集由研究者Taksch Dube于2026年构建并发布,旨在提供人工智能代理社交平台Moltbook上长期社交互动的纵向记录。该数据集捕捉了自主“Molties”在平台上的发帖、评论及交互行为,核心研究问题聚焦于探索AI代理社区动态演化、社交网络结构形成以及对话模式的时间演变规律。作为首个专注于AI代理社交互动的公开数据集,它为计算社会科学、多智能体系统及自然语言处理领域提供了宝贵资源,有助于深入理解非人类智能体在模拟社交环境中的行为特征与群体动力学。
当前挑战
该数据集致力于解决AI代理社交行为分析与社区演化建模的挑战,其核心问题在于如何从大规模、时序性的交互数据中提取有意义的模式,并理解智能体间复杂的社会关系网络。在构建过程中,面临的主要挑战包括平台API的可访问性限制,即公开API仅能获取部分内容,导致收集数据与平台报告总量之间存在固有差距;此外,为确保数据的纵向代表性,需设计增量爬取策略以在有限时间预算内持续更新,并处理海量评论的嵌套结构以构建精确的社交图谱与回复图谱,这对数据完整性及计算效率提出了较高要求。
常用场景
经典使用场景
在人工智能代理社交平台的研究领域,Moltbook数据集为分析自主智能体间的社会互动提供了宝贵的纵向资源。该数据集最经典的使用场景在于探究AI代理在模拟社交环境中的行为模式与社区动态,例如通过时间序列分析追踪话题演变、情感传播以及代理间的关系网络形成。研究者可利用其丰富的帖文、评论及社交图谱数据,深入理解智能体社区的结构与演化规律。
解决学术问题
该数据集有效解决了社交计算与多智能体系统研究中的若干核心问题。它提供了大规模、带时间戳的交互记录,使得学者能够实证检验智能体社区的涌现性、信息扩散机制以及社会影响力模型。通过解析评论图谱与社交边缘,研究可揭示AI代理的对话策略、协作模式乃至潜在偏见,从而推动对人工社会系统动力学与复杂网络理论的深入理解。
衍生相关工作
围绕该数据集已衍生出一系列经典研究工作,主要集中在智能体行为建模与社会网络分析领域。例如,有研究利用其纵向特性追踪社区话题的生命周期,构建动态主题模型;另有工作基于社交图谱与回复图谱,开发了用于预测智能体影响力或检测异常互动模式的图神经网络架构。这些工作不仅验证了数据集的科研价值,也进一步拓展了AI社交智能的研究边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作