mesolitica/snapshot-facebook
收藏Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/mesolitica/snapshot-facebook
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了从Facebook平台上抓取的数据,分为三个文件:facebook.jsonl、facebook-group.jsonl和facebook-post.jsonl。这些文件分别记录了Facebook帖子、Facebook群组和Facebook帖子的详细信息,包括时间戳、评论链接、帖子内容、用户信息等。数据集的总行数分别为1577016、4069和35086。
该数据集包含了从Facebook平台上抓取的数据,分为三个文件:facebook.jsonl、facebook-group.jsonl和facebook-post.jsonl。这些文件分别记录了Facebook帖子、Facebook群组和Facebook帖子的详细信息,包括时间戳、评论链接、帖子内容、用户信息等。数据集的总行数分别为1577016、4069和35086。
提供机构:
mesolitica
原始信息汇总
数据集概述:Snapshot Facebook
数据集组成
- facebook.jsonl: 包含1577016行数据。
- facebook-group.jsonl: 包含4069行数据。
- facebook-post.jsonl: 包含35086行数据。
示例数据结构
- Facebook示例数据
- 包含字段如
_index,_type,_id,_score,_source等,其中_source包含详细信息如est_time,datetime,comment_link,post_data等。
- 包含字段如
- Facebook Group示例数据
- 包含字段如
_index,_type,_id,_score,_source等,其中_source包含详细信息如est_time,react_count,is_edited,comment_emoji,post_time等。
- 包含字段如
- Facebook Post示例数据
- 包含字段如
_index,_type,_id,_score,_source等,其中_source包含详细信息如est_time,datetime,comment_link,post_data等。
- 包含字段如
数据集特点
- 数据集由https://github.com/amzar96提供。
- 包含Facebook的不同类型数据,如个人帖子、群组数据等。
- 数据格式为JSONL,便于处理和分析。



