five

moltbook-dataset

收藏
Hugging Face2026-02-08 更新2026-02-09 收录
下载链接:
https://huggingface.co/datasets/takschdube/moltbook-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Moltbook数据集是一个从Moltbook平台自动收集并发布的纵向社交互动数据集,包含时间戳标记的版本发布。数据集分为原始数据和派生数据两部分:原始数据包括子社区(submolts)、帖子(posts)、完整帖子(含评论)、平台统计和元数据;派生数据包括代理(agents)信息、社交图谱、回复图谱、活动时间线和子社区统计。数据集以时间戳压缩包形式发布,每6小时自动生成一次,适合进行时间序列分析。数据文件采用JSON格式,包含详细的字段说明,如帖子ID、标题、内容、作者信息、投票数、评论数等。数据集适用于社交网络分析、社区动态研究等任务。数据收集遵循公开API规则,仅包含公开可见内容,并尊重API速率限制。数据集采用CC BY 4.0许可,代码采用MIT许可。

The Moltbook Dataset is a longitudinal social interaction dataset automatically collected and published from the Moltbook platform, with timestamped version releases. The dataset is divided into raw data and derived data: Raw data includes submolt communities (submolts), posts, full posts (including comments), platform statistics and metadata; Derived data includes agent information, social graphs, reply graphs, activity timelines and subcommunity statistics. The dataset is released as timestamped compressed packages, which are automatically generated every 6 hours, making it suitable for time series analysis. The data files are in JSON format, with detailed field specifications including post ID, title, content, author information, vote count, comment count and other related items. The dataset is applicable to tasks such as social network analysis and community dynamics research. Data collection follows public API regulations, only contains publicly visible content, and complies with API rate limits. The dataset is licensed under CC BY 4.0, while the accompanying code is licensed under the MIT License.
创建时间:
2026-02-08
搜集汇总
数据集介绍
main_image_url
构建方式
在社交网络研究领域,获取高质量的纵向交互数据对于理解社区动态至关重要。Moltbook数据集通过自动化爬虫系统从Moltbook平台的公开API中持续采集数据,每六小时生成一次带时间戳的数据快照。原始数据包括帖子、评论及用户信息,随后通过计算生成衍生数据,如社交图谱和活动时间线,从而构建出一个结构完整且适合时序分析的数据档案。
使用方法
利用该数据集时,研究者可通过发布的时间戳压缩包获取特定时刻的数据快照,适用于纵向比较研究。原始数据文件可直接用于内容分析,而衍生数据如社交图谱则便于进行网络科学计算。数据集支持本地运行,用户可配置API密钥进行增量更新,并通过配套脚本重新生成衍生数据,从而灵活适配各类社交计算与行为分析的实验需求。
背景与挑战
背景概述
Moltbook数据集由Taksch Dube于2026年创建,旨在为社交互动研究提供纵向数据资源。该数据集源自Moltbook平台的公共API,系统性地采集了帖子、评论、用户及社区等多维度信息,并构建了社交图与回复图等衍生结构。其核心研究问题聚焦于在线社交动态的演化模式、用户行为分析以及社区形成机制,为计算社会科学、网络科学及人机交互等领域提供了实证基础,推动了时序社交数据分析方法的发展。
当前挑战
该数据集致力于解决在线社交互动分析的挑战,包括捕捉动态演化的用户关系、量化社区影响力以及理解信息传播模式。在构建过程中,面临数据采集的完整性保障、API速率限制下的高效爬取、大规模时序数据的一致性维护以及用户隐私与数据公开性的平衡等具体难题。此外,衍生图的构建需处理复杂互动关系的准确映射,确保纵向分析中数据快照的可比性与可靠性。
常用场景
经典使用场景
在社交网络分析领域,Moltbook数据集以其纵向时间序列特性,为研究者提供了探索在线社区动态演化的宝贵资源。该数据集通过自动收集并发布带时间戳的快照,经典地应用于分析用户互动模式、社区结构变迁以及信息传播机制。例如,利用其社交图谱和回复图谱,学者能够深入挖掘代理(Molty)之间的交互网络,揭示意见领袖的形成路径或群体极化现象,从而理解虚拟社交生态的运作规律。
解决学术问题
该数据集有效解决了社交计算研究中关于在线行为长期追踪的难题。传统社交数据往往局限于静态快照,难以捕捉时间维度上的细微变化。Moltbook通过定期发布的纵向数据,使学者能够系统探究用户参与度的波动、社区话题的兴衰周期以及网络结构的动态稳定性。这不仅为验证社会网络理论提供了实证基础,还推动了时序图神经网络等前沿方法的发展,深化了对人机交互复杂性的认知。
实际应用
在实际应用层面,Moltbook数据集为平台优化和内容管理提供了数据支撑。产品团队可依据活动时间线分析用户活跃峰值,优化服务器资源分配;社区管理者借助子社区统计识别高互动话题,制定精准的内容推广策略。此外,衍生出的社交图谱有助于检测异常行为模式,如机器人账户识别或网络欺凌预警,从而提升平台健康度,营造更安全的在线交流环境。
数据集最近研究
最新研究方向
在社交网络分析领域,Moltbook数据集作为新兴的纵向社交互动数据源,正推动着多智能体系统与在线社区动态的前沿探索。研究者们聚焦于利用其时间戳标注的发布序列,深入剖析智能体(Molty)在异构社区中的行为演化模式,结合社交图与回复图的结构特征,揭示人机混合环境中信息传播的独特机制。热点议题围绕人工智能驱动的虚拟身份如何塑造在线话语生态,以及纵向数据如何赋能社会计算模型对社区兴衰的预测能力。该数据集为理解新兴社交平台的动态复杂性提供了实证基础,对人工智能伦理、网络治理及虚拟社会建模具有重要参考价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作