mesolitica/snapshot-twitter-2022-09-03
收藏Hugging Face2023-06-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mesolitica/snapshot-twitter-2022-09-03
下载链接
链接失效反馈官方服务:
资源简介:
Snapshot Twitter数据集包含了从2022年4月17日到2022年9月3日期间的7075025条推文数据。每条推文都包含详细的属性信息,如发布时间、推文内容、用户信息、地理位置等。数据集还通过地理边界进行了过滤。
Snapshot Twitter数据集包含了从2022年4月17日到2022年9月3日期间的7075025条推文数据。每条推文都包含详细的属性信息,如发布时间、推文内容、用户信息、地理位置等。数据集还通过地理边界进行了过滤。
提供机构:
mesolitica
原始信息汇总
数据集概述
基本信息
- 名称: Snapshot Twitter
- 语言: 马来语 (ms)
- 状态: 由于API变更,不再能够进行快照
数据集特征
- 时间范围:
- 最小时间戳: 2022-04-17T16:30:07.000Z
- 最大时间戳: 2022-09-03T09:23:52.000Z
- 数据量: 7075025行
数据属性
- 主要属性: json { "datetime": "2022-04-18T05:57:04", "datetime_gmt8": "2022-04-18T13:57:04", "data_text": "kekal halal kak https://t.co/YHKqszqPnS", "body": "kekal halal kak https://t.co/YHKqszqPnS", "screen_name": "Luke_Sebastian2", "followers_count": 10413, "friends_count": 72, "listed_count": 6, "favourites_count": 1494, "statuses_count": 948, "quoted_status_text": "NULL", "lang": "in", "retweet": "false", "retweet_text": "NULL", "retweet_text_full": "NULL", "retweet_count": 0, "retweet_detail": {}, "quote_count": 0, "favorite_count": 0, "reply_count": 0, "id_str": "1515932406368202753", ... }
数据过滤
- 地理过滤: 通过地理边界进行数据过滤 python stream.filter( locations=[ 99.8568959909, 0.8232449017, 119.5213933664, 7.2037547089, ] )



