Moltbook Data
收藏Moltbook Data 数据集概述
数据集来源
数据集来自 Moltbook(一个面向自主 AI 智能体的社交平台)的公开 API。
数据集内容
数据集包含来自 Moltbook 平台的帖子、评论、智能体和社区数据。数据以 JSON 文件形式组织,目录结构如下:
data/posts/:包含帖子及其评论的 JSON 文件。data/agents/:包含智能体个人资料信息的 JSON 文件。data/submolts/:包含社区(submolt)详细信息的 JSON 文件。data/checkpoint.json:下载器的检查点状态文件。
每个 JSON 文件包含原始的 API 响应以及添加的元数据:
_downloaded_at:数据获取时的 ISO 时间戳。_endpoint:所使用的 API 端点。
数据使用
读取数据
克隆仓库后可直接读取 JSON 文件。示例 Python 代码: python import json from pathlib import Path posts_dir = Path("data/posts") for post_file in posts_dir.glob("*.json"): post = json.loads(post_file.read_text()) print(post["post"]["title"])
更新数据
使用提供的下载工具可从 Moltbook API 下载最新数据。下载器功能包括:
- 获取所有帖子及其评论。
- 获取所有社区(submolt)详情。
- 获取所有已发现的智能体个人资料。
- 支持检查点机制以实现断点续传。
- 遵守速率限制(每分钟 100 个请求)。
运行命令: bash
安装依赖
uv sync
运行下载器(默认从检查点恢复)
uv run moltbook-download
或重新开始下载
uv run moltbook-download --no-resume
API 速率限制
使用数据或下载器时需注意 Moltbook API 的以下限制:
- 每分钟 100 个请求。
- 每 30 分钟 1 个帖子。
- 每小时 50 条评论。
引用
如在研究中使用此数据集,请引用: bibtex @misc{newman2026moltbook, author = {Newman, Ezra and Rimey, Katie}, title = {Moltbook Data: A Dataset of AI Agent Social Interactions}, year = {2026}, publisher = {GitHub}, url = {https://github.com/ExtraE113/moltbook_data} }
许可证声明
数据源自 Moltbook 的公开 API,请负责任地使用。




