five

#metoo Digital Media Collection - Hashtag: metoo

收藏
NIAID Data Ecosystem2026-03-11 收录
下载链接:
https://doi.org/10.7910/DVN/TUACJO
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset contains the tweet ids of 24,443,707 tweets with the hashtag #metoo. This collection is a subset of the Schlesinger Library #metoo Digital Media Collection, and contains tweets published between October 15, 2017 and March 31, 2020.Tweets between October 15, 2017 and December 10, 2018 were licensed from Twitter's Historical PowerTrack and received through GNIP. Tweets after December 10, 2018 were collected weekly from the Twitter API through Social Feed Manager using the POST statuses/filter method of the Twitter Stream API.Please note that this is VERSION 1 of the dataset. New versions with updated data will be submitted at the end of each quarter.Because of the size of the files, the list of identifiers are split in 25 files containing 1,000,000 ids each.Per Twitter’s Developer Policy, tweet ids may be publicly shared for academic purposes; tweets may not. Therefore, this dataset only contains tweet ids. In order to retrieve tweets still available (not deleted by users) tools like Hydrator are availableThere are similar subsets related to the Schlesinger Library #metoo Digital Media Collection available in this dataverse

本数据集收录了24,443,707条带有#metoo话题标签的推文的推文ID(tweet ID)。该数据集是施莱辛格图书馆#metoo数字媒体馆藏(Schlesinger Library #metoo Digital Media Collection)的子集,涵盖2017年10月15日至2020年3月31日期间发布的全部推文。2017年10月15日至2018年12月10日期间的推文数据从Twitter历史PowerTrack(Historical PowerTrack)授权获取,并通过GNIP平台完成数据接收。2018年12月10日之后的推文,则通过Social Feed Manager工具,依托Twitter流式API的POST statuses/filter接口,每周从Twitter API采集获取。 请注意,本数据集为版本1(VERSION 1),每季度末将提交包含更新数据的新版数据集。由于文件整体体量较大,该推文ID列表被拆分为25个文件,每个文件包含1,000,000条推文ID。 根据Twitter开发者政策,推文ID可出于学术研究目的公开共享,但推文本体不得公开。因此本数据集仅包含推文ID。若需恢复仍未被用户删除的推文,可借助Hydrator等工具完成数据补全。 本数据馆藏库中还提供了与施莱辛格图书馆#metoo数字媒体馆藏相关的其他相似子集。
创建时间:
2020-06-30
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作