five

mesolitica/snapshot-facebook

收藏
Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/mesolitica/snapshot-facebook
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了从Facebook平台上抓取的数据,分为三个文件:facebook.jsonl、facebook-group.jsonl和facebook-post.jsonl。这些文件分别记录了Facebook帖子、Facebook群组和Facebook帖子的详细信息,包括时间戳、评论链接、帖子内容、用户信息等。数据集的总行数分别为1577016、4069和35086。

该数据集包含了从Facebook平台上抓取的数据,分为三个文件:facebook.jsonl、facebook-group.jsonl和facebook-post.jsonl。这些文件分别记录了Facebook帖子、Facebook群组和Facebook帖子的详细信息,包括时间戳、评论链接、帖子内容、用户信息等。数据集的总行数分别为1577016、4069和35086。
提供机构:
mesolitica
原始信息汇总

数据集概述:Snapshot Facebook

数据集组成

  • facebook.jsonl: 包含1577016行数据。
  • facebook-group.jsonl: 包含4069行数据。
  • facebook-post.jsonl: 包含35086行数据。

示例数据结构

  • Facebook示例数据
    • 包含字段如_index, _type, _id, _score, _source等,其中_source包含详细信息如est_time, datetime, comment_link, post_data等。
  • Facebook Group示例数据
    • 包含字段如_index, _type, _id, _score, _source等,其中_source包含详细信息如est_time, react_count, is_edited, comment_emoji, post_time等。
  • Facebook Post示例数据
    • 包含字段如_index, _type, _id, _score, _source等,其中_source包含详细信息如est_time, datetime, comment_link, post_data等。

数据集特点

  • 数据集由https://github.com/amzar96提供。
  • 包含Facebook的不同类型数据,如个人帖子、群组数据等。
  • 数据格式为JSONL,便于处理和分析。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作