Moltbook Data

github2026-02-06 更新2026-02-03 收录

下载链接：

https://github.com/ExtraE113/moltbook_data

下载链接

链接失效反馈

官方服务：

资源简介：

Moltbook Data是一个完整的来自Moltbook（一个自主AI代理的社交平台）的帖子、评论、代理和社区的数据集。

Moltbook Data is a comprehensive dataset composed of posts, comments, agents, and communities sourced from Moltbook, a social platform dedicated to autonomous AI agents.

创建时间：

2026-01-31

原始信息汇总

Moltbook Data 数据集概述

数据集来源

数据集来自 Moltbook（一个面向自主 AI 智能体的社交平台）的公开 API。

数据集内容

数据集包含来自 Moltbook 平台的帖子、评论、智能体和社区数据。数据以 JSON 文件形式组织，目录结构如下：

data/posts/：包含帖子及其评论的 JSON 文件。
data/agents/：包含智能体个人资料信息的 JSON 文件。
data/submolts/：包含社区（submolt）详细信息的 JSON 文件。
data/checkpoint.json：下载器的检查点状态文件。

每个 JSON 文件包含原始的 API 响应以及添加的元数据：

_downloaded_at：数据获取时的 ISO 时间戳。
_endpoint：所使用的 API 端点。

数据使用

读取数据

克隆仓库后可直接读取 JSON 文件。示例 Python 代码： python import json from pathlib import Path posts_dir = Path("data/posts") for post_file in posts_dir.glob("*.json"): post = json.loads(post_file.read_text()) print(post["post"]["title"])

更新数据

使用提供的下载工具可从 Moltbook API 下载最新数据。下载器功能包括：

获取所有帖子及其评论。
获取所有社区（submolt）详情。
获取所有已发现的智能体个人资料。
支持检查点机制以实现断点续传。
遵守速率限制（每分钟 100 个请求）。

运行命令： bash

安装依赖

uv sync

运行下载器（默认从检查点恢复）

uv run moltbook-download

或重新开始下载

uv run moltbook-download --no-resume

API 速率限制

使用数据或下载器时需注意 Moltbook API 的以下限制：

每分钟 100 个请求。
每 30 分钟 1 个帖子。
每小时 50 条评论。

引用

如在研究中使用此数据集，请引用： bibtex @misc{newman2026moltbook, author = {Newman, Ezra and Rimey, Katie}, title = {Moltbook Data: A Dataset of AI Agent Social Interactions}, year = {2026}, publisher = {GitHub}, url = {https://github.com/ExtraE113/moltbook_data} }

许可证声明

数据源自 Moltbook 的公开 API，请负责任地使用。

搜集汇总

数据集介绍

构建方式

在人工智能社交平台研究领域，数据集的构建方法直接影响其科学价值。Moltbook Data 通过系统化爬取 Moltbook 平台的公开 API 接口构建而成，该平台是一个专为自主 AI 代理设计的社交环境。数据采集过程采用了结构化的下载器工具，该工具能够自动获取平台上的帖子及其关联评论、社区（submolt）详情以及已发现的智能体（agent）档案。为确保数据获取的完整性与可恢复性，下载器内置了检查点机制，支持从中断处继续执行。整个过程严格遵守平台设定的访问速率限制，例如每分钟 100 次请求，以符合伦理和数据使用规范，最终生成包含原始 API 响应及附加元数据的 JSON 文件集合。

特点

该数据集的核心特点在于其全面记录了 AI 智能体在模拟社交环境中的互动轨迹。数据集内容涵盖帖子、评论、智能体档案和社区信息等多个维度，形成了一个多模态、结构化的社交图谱。每个数据文件不仅保留了 API 的原始响应，还额外附带了数据获取时间戳和所用端点等元数据，增强了数据的可追溯性和可复现性。数据组织形式清晰，按实体类型分目录存储，便于研究人员按需访问。尤为重要的是，数据来源于一个新兴的、专注于 AI 代理交互的独特平台，为研究机器社交行为、群体智能和对话生成提供了稀缺且高质量的实证材料。

使用方法

对于希望利用该数据集开展研究的人员，其使用方法直接而高效。研究者首先需克隆代码仓库至本地，随后可通过标准的文件读取操作（例如使用 Python 的 `json` 和 `pathlib` 库）直接解析存储于 `data/` 目录下的 JSON 文件，从而访问具体的帖子标题、评论内容或智能体属性。若需获取最新数据，可使用项目提供的下载器脚本，在配置好依赖后执行相应命令即可从 Moltbook API 重新抓取。下载器支持断点续传和速率控制，确保了数据获取过程的稳定与合规。这种设计使得数据集既能用于静态分析，也支持动态更新，灵活适配不同的研究场景与时效性要求。

背景与挑战

背景概述

随着人工智能技术的迅猛发展，自主智能体在社会交互中的行为模式研究逐渐成为前沿领域。Moltbook Data数据集由研究人员Ezra Newman和Katie Rimey于2026年创建，旨在系统性地收集并整理来自Moltbook社交平台的公开数据，包括帖子、评论、智能体档案及社区信息。该数据集的核心研究问题聚焦于探索自主AI智能体在模拟社交环境中的互动机制、内容生成规律以及社区形成动态，为计算社会科学、多智能体系统及人机交互等领域提供了宝贵的实证研究资源，推动了智能体社会行为建模的深入分析。

当前挑战

在智能体社交交互研究领域，如何准确捕捉并解析非人类实体在复杂社交网络中的行为语义与关系演化，构成了核心挑战。Moltbook Data数据集在构建过程中面临多重困难：其一，数据采集需严格遵循平台API的速率限制，如每分钟100次请求、每30分钟仅能获取一条帖子，这显著延长了数据收集周期并增加了时序一致性维护的复杂度；其二，原始API响应虽包含元数据如下载时间戳与端点信息，但缺乏统一的结构化标注，需额外处理以支持高层次语义分析；其三，智能体行为的动态性与社区结构的演变特性，要求数据集具备持续更新能力，而检查点机制虽支持断点续传，却可能引入数据覆盖或版本管理问题。

常用场景

经典使用场景

在人工智能与社交计算交叉领域，Moltbook Data数据集为研究自主AI代理的社交行为提供了宝贵资源。该数据集通过捕捉Moltbook平台上代理发布的帖子、评论、社区互动及代理档案，构建了一个动态的社交网络图谱。研究者可借此分析AI代理在模拟社交环境中的交互模式、话题演化及群体动态，为理解多代理系统的社会性行为奠定数据基础。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作。例如，有研究利用其代理互动数据训练社交感知模型，以提升AI代理的语境理解能力；另有工作基于社区结构分析，提出了多代理协作的新框架。这些成果不仅丰富了社交计算的理论体系，也为开发更自然、高效的自主代理系统提供了方法论支持。

数据集最近研究