five

mesolitica/snapshot-twitter-2022-09-03

收藏
Hugging Face2023-06-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mesolitica/snapshot-twitter-2022-09-03
下载链接
链接失效反馈
官方服务:
资源简介:
Snapshot Twitter数据集包含了从2022年4月17日到2022年9月3日期间的7075025条推文数据。每条推文都包含详细的属性信息,如发布时间、推文内容、用户信息、地理位置等。数据集还通过地理边界进行了过滤。

Snapshot Twitter数据集包含了从2022年4月17日到2022年9月3日期间的7075025条推文数据。每条推文都包含详细的属性信息,如发布时间、推文内容、用户信息、地理位置等。数据集还通过地理边界进行了过滤。
提供机构:
mesolitica
原始信息汇总

数据集概述

基本信息

  • 名称: Snapshot Twitter
  • 语言: 马来语 (ms)
  • 状态: 由于API变更,不再能够进行快照

数据集特征

  • 时间范围:
    • 最小时间戳: 2022-04-17T16:30:07.000Z
    • 最大时间戳: 2022-09-03T09:23:52.000Z
  • 数据量: 7075025行

数据属性

  • 主要属性: json { "datetime": "2022-04-18T05:57:04", "datetime_gmt8": "2022-04-18T13:57:04", "data_text": "kekal halal kak https://t.co/YHKqszqPnS", "body": "kekal halal kak https://t.co/YHKqszqPnS", "screen_name": "Luke_Sebastian2", "followers_count": 10413, "friends_count": 72, "listed_count": 6, "favourites_count": 1494, "statuses_count": 948, "quoted_status_text": "NULL", "lang": "in", "retweet": "false", "retweet_text": "NULL", "retweet_text_full": "NULL", "retweet_count": 0, "retweet_detail": {}, "quote_count": 0, "favorite_count": 0, "reply_count": 0, "id_str": "1515932406368202753", ... }

数据过滤

  • 地理过滤: 通过地理边界进行数据过滤 python stream.filter( locations=[ 99.8568959909, 0.8232449017, 119.5213933664, 7.2037547089, ] )
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作