five

Coronavirus (COVID-19) Global Sentiment Trend

收藏
Mendeley Data2024-01-31 更新2024-06-29 收录
下载链接:
https://ieee-dataport.org/open-access/coronavirus-covid-19-global-sentiment-trend
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset gives a cursory glimpse at the overall sentiment trend of the public discourse regarding the COVID-19 pandemic on Twitter. The live scatter plot of this dataset is available as The Overall Trend block at https://live.rlamsal.com.np. The trend graph reveals multiple peaks and drops that need further analysis. The n-grams during those peaks and drops can prove beneficial for better understanding the discourse.The dataset will be updated weekly and will continue until the development of the Coronavirus (COVID-19) Tweets Dataset is ongoing.A quick overview of the datasetThe sentiment scores are defined in the range [-1,0), 0, and (0,+1] for negative sentiment, neutral sentiment, and positive sentiment. Since the number of negative sentiment tweets is always less than the combined number of neutral and positive sentiment tweets, the majority of the time, the average sentiment falls pretty close to +0.05. So if we consider +0.05 as the neutral point for average sentiment score, then any score greater than +0.1 (peaks) and smaller than 0 (drops) can be regarded as a point of interest for further scrutinizing. Following are the dates when the Twitter stream (based on the tweets present in the Coronavirus (COVID-19) Tweets Dataset) experienced those peaks and drops:Positive peaks: In 2020 (April 30, May 3, May 23, May 24, May 25, May 26, June 2, June 22, June 28, July 3, July 12, July 26, August 15, August 16, August 18, August 21, August 24, August 31, September 1, September 2, September 4, September 5, September 9, September 21, September 23)Negative Peaks: In 2020 (May 28, May 30, May 31, June 1, June 2, June 7, June 8, June 12, June 13, June 14, June 15, June 21, June 24, june 25, July 6, July 7, July 10, August 26, September 1, September 3, September 13, September 17, September 25, September 26, September 28)What's inside the dataset files?Tweets collected every 10 minutes are sampled together, and an average sentiment score is computed. This dataset contains TXT files, each with two columns: (i) date/time and (ii) average sentiment. The first column is date/time and is by default in Unix timestamp (in ms). You can use this formula =cell/1000/60/60/24 + DATE(1970,1,1) in Spreadsheets, or this pd.to_datetime(dataframe_name[column],unit='ms') if you're comfortable with Python, to convert the Unix timestamp to human-readable format. There are 44 instances where the average sentiment score is NULL because of networking issues with the cloud service.

本数据集简要呈现了Twitter平台上围绕新型冠状病毒肺炎(COVID-19)疫情的公众言论整体情感趋势。该数据集的实时散点图可于https://live.rlamsal.com.np 的「整体趋势」板块获取。该趋势图呈现出多组峰值与谷值,有待进一步深入分析。上述峰值与谷值时段的n元语法组(n-grams),可助力更深入地理解该公共言论语境。本数据集将每周更新,直至《新型冠状病毒肺炎(COVID-19)推文数据集》的开发工作完成。 数据集快速概览 情感评分的区间定义如下:[-1,0)为负面情感,0为中性情感,(0,+1]为正面情感。由于负面情感推文的数量始终少于中性与正面情感推文的总和,多数情况下平均情感得分趋近于+0.05。因此,若将+0.05作为平均情感得分的中性基准点,则得分大于+0.1(峰值)与得分小于0(谷值)的节点,均可视为需进一步细致审视的关注点。以下为基于《新型冠状病毒肺炎(COVID-19)推文数据集》中的推文所构建的Twitter数据流出现上述峰值与谷值的日期: 正面峰值:2020年(4月30日、5月3日、5月23日、5月24日、5月25日、5月26日、6月2日、6月22日、6月28日、7月3日、7月12日、7月26日、8月15日、8月16日、8月18日、8月21日、8月24日、8月31日、9月1日、9月2日、9月4日、9月5日、9月9日、9月21日、9月23日) 负面峰值:2020年(5月28日、5月30日、5月31日、6月1日、6月2日、6月7日、6月8日、6月12日、6月13日、6月14日、6月15日、6月21日、6月24日、6月25日、7月6日、7月7日、7月10日、8月26日、9月1日、9月3日、9月13日、9月17日、9月25日、9月26日、9月28日) 数据集文件内容说明 每10分钟采集的推文将被合并采样,并计算平均情感得分。本数据集包含TXT格式文件,每个文件均包含两列:(i) 日期/时间,(ii) 平均情感得分。第一列为日期/时间,默认采用毫秒级Unix时间戳(Unix timestamp)格式。你可在电子表格中使用公式=cell/1000/60/60/24 + DATE(1970,1,1),或在Python中使用pd.to_datetime(dataframe_name[column],unit='ms')将Unix时间戳转换为人类可读的格式。由于云服务出现网络问题,共有44条记录的平均情感得分为空值。
创建时间:
2024-01-31
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作