five

Coronavirus (COVID-19) Tweets Sentiment Trend (Global)

收藏
Mendeley Data2024-01-31 更新2024-06-27 收录
下载链接:
https://ieee-dataport.org/open-access/coronavirus-covid-19-tweets-sentiment-trend-global
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset gives a cursory glimpse at the overall sentiment trend of the public discourse regarding the COVID-19 pandemic on Twitter. The live scatter plot of this dataset is available as The Overall Trend block at https://live.rlamsal.com.np. The trend graph reveals multiple peaks and drops that need further analysis. The n-grams during those peaks and drops can prove beneficial for better understanding the discourse.The dataset will be updated weekly and will continue until the development of the Coronavirus (COVID-19) Tweets Dataset is ongoing.A quick overview of the datasetThe sentiment scores are defined in the range [-1,0), 0, and (0,+1] for negative sentiment, neutral sentiment, and positive sentiment. Since the number of negative sentiment tweets is always less than the combined number of neutral and positive sentiment tweets, the majority of the time, the average sentiment falls pretty close to +0.05. So if we consider +0.05 as the neutral point for average sentiment score, then any score greater than +0.1 (peaks) and smaller than 0 (drops) can be regarded as a point of interest for further scrutinizing. Following are the dates when the Twitter stream (based on the tweets present in the Coronavirus (COVID-19) Tweets Dataset) experienced those peaks and drops:Positive peaks: In 2020 (April 30, May 3, May 23, May 24, May 25, May 26, June 2, June 22, June 28, July 3, July 12, July 26, August 15, August 16, August 18, August 21, August 24, August 31, September 1, September 2, September 4, September 5, September 9, September 21, September 23, October 2)Negative Peaks: In 2020 (May 28, May 30, May 31, June 1, June 2, June 7, June 8, June 12, June 13, June 14, June 15, June 21, June 24, june 25, July 6, July 7, July 10, August 26, September 1, September 3, September 13, September 17, September 25, September 26, September 28, October 5)What's inside the dataset files?Tweets collected every 10 minutes are sampled together, and an average sentiment score is computed. This dataset contains TXT files, each with two columns: (i) date/time (in UTC) and (ii) average sentiment. The first column is date/time and is by default in Unix timestamp (in ms). You can use this formula =cell/1000/60/60/24 + DATE(1970,1,1) in Spreadsheets, or this pd.to_datetime(dataframe_name[column],unit='ms') if you're comfortable with Python, to convert the Unix timestamp to human-readable format. There are 44 instances where the average sentiment score is NULL because of networking issues with the cloud service.

本数据集简要展现了推特(Twitter)上围绕新型冠状病毒肺炎(COVID-19)大流行的公众讨论的整体情感倾向趋势。本数据集的实时散点图可于https://live.rlamsal.com.np 的「整体趋势」板块查看。该趋势图呈现出多处波动峰值与谷值,有待进一步分析。这些波动峰值与谷值对应的n元语法(n-grams)有助于更深入地理解相关公众讨论内容。本数据集将按周更新,持续至新型冠状病毒肺炎(COVID-19)推特数据集的开发工作处于进行中的阶段。 数据集快速概览: 情感评分的取值范围定义如下:[-1, 0) 对应负面情感,0 对应中性情感,(0, +1] 对应正面情感。由于负面情感推文的数量始终少于中性与正面情感推文的总和,多数情况下平均情感得分会非常接近+0.05。因此若将+0.05视为平均情感得分的中性基准点,则任何大于+0.1的得分(对应峰值)以及小于0的得分(对应谷值)均可视为值得进一步细致分析的关键点。以下为基于新型冠状病毒肺炎(COVID-19)推特数据集的推特数据流出现上述峰值与谷值的日期: 正面情感峰值:2020年(4月30日、5月3日、5月23日、5月24日、5月25日、5月26日、6月2日、6月22日、6月28日、7月3日、7月12日、7月26日、8月15日、8月16日、8月18日、8月21日、8月24日、8月31日、9月1日、9月2日、9月4日、9月5日、9月9日、9月21日、9月23日、10月2日) 负面情感峰值:2020年(5月28日、5月30日、5月31日、6月1日、6月2日、6月7日、6月8日、6月12日、6月13日、6月14日、6月15日、6月21日、6月24日、6月25日、7月6日、7月7日、7月10日、8月26日、9月1日、9月3日、9月13日、9月17日、9月25日、9月26日、9月28日、10月5日) 数据集文件包含哪些内容? 数据集文件包含每10分钟采集的推文样本,并计算得到平均情感得分。本数据集包含若干TXT文件,每个文件均包含两列:(i) 日期/时间(采用协调世界时(UTC)),(ii) 平均情感得分。第一列为日期/时间,默认采用Unix时间戳(Unix timestamp,毫秒级)。若使用电子表格软件,可通过公式`=cell/1000/60/60/24 + DATE(1970,1,1)`将其转换为可读格式;若使用Python,则可通过`pd.to_datetime(dataframe_name[column],unit='ms')`实现转换。由于云服务出现网络故障,共有44条记录的平均情感得分为空值(NULL)。
创建时间:
2024-01-31
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作