气候变化的推文数据集
收藏arXiv2025-03-12 更新2025-03-14 收录
下载链接:
http://arxiv.org/abs/2503.09361v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含2019年在X(前Twitter)上分享的与气候变化相关的730k条推文及其共享的图片。数据集由德国曼海姆大学数据与网络科学组等机构创建,旨在通过图像分类、目标检测和情感分析探索气候话语中的视觉叙事。数据集涵盖了推文文本、日期、作者ID以及用户反应等信息,并针对不同的分析目的创建了子集,包括最受欢迎的5k个推文子集、随机选择的10k个推文子集以及500个用于情感分析的手动标注图像子集。
This dataset contains 730,000 climate change-related tweets and their accompanying shared images, which were posted on X (formerly Twitter) in 2019. It was developed by institutions including the Data and Web Science Group at the University of Mannheim, Germany, with the goal of exploring visual narratives in climate discourse through image classification, object detection, and sentiment analysis. The dataset provides comprehensive information such as tweet text, posting date, author ID, and user reactions. Additionally, it includes curated subsets for diverse analytical use cases: a subset of the 5,000 most popular tweets, a randomly selected subset of 10,000 tweets, and a manually annotated subset of 500 images intended for sentiment analysis.
提供机构:
德国曼海姆大学数据与网络科学组,慕尼黑工业大学治理学院,德国曼海姆大学及马克斯·普朗克信息学院
创建时间:
2025-03-12
搜集汇总
数据集介绍

构建方式
本研究构建了一个包含73万条关于气候变化的推文数据集,时间跨度为2019年。数据集通过X平台(原Twitter)的学术API获取,包含推文文本、日期、作者ID以及用户反应(如点赞、转发、分享)。为了提高分析效率,数据集被划分为三个子集:最热门的5千条推文子集、随机选取的1万条推文子集以及500条人工标注的图像情感子集。
特点
该数据集的特点在于:1)融合了图像分类、物体检测和情感分析的多模态分析;2)应用了Gemini Pro和Moondream两种基础模型进行图像分类和情感分析;3)包含了一个互动式的图形用户界面(GUI),便于深入评估模型预测。
使用方法
使用该数据集时,用户可以通过GUI预览推文图像,查看关键推文信息以及相应的模型预测结果。用户还可以利用GUI中的筛选功能对推文进行文本-based的筛选。数据集的获取和分析可以通过Python的Flask框架和Pandas库实现,以支持大数据量的处理和自定义函数应用。
背景与挑战
背景概述
气候变化的推文数据集是一个包含2019年X平台(原Twitter)上关于气候变化的730k条推文及其共享图像的数据集。该数据集由Katharina Prasse、Marcel Kleinmann等研究人员创建,旨在通过统计分析、图像分类、对象检测和情感分析来探索视觉叙事在气候话语中的作用。数据集的核心研究问题是分析气候变化的社交媒体话语,尤其是图像在其中的角色。该数据集对相关领域产生了重要影响,为气候变化的社交媒体研究提供了新的视角和工具。
当前挑战
该数据集面临的挑战主要包括:1)解决领域问题方面的挑战,即如何准确地进行图像分类、对象检测和情感分析,以揭示视觉叙事在气候话语中的作用;2)构建过程中的挑战,包括数据集的选取、标注和模型的选择与训练。在解决领域问题方面,模型往往难以识别讽刺、挖苦等情境下的情感,导致情感分析结果存在偏差。在构建过程中,需要克服数据集标注的主观性和模型训练的计算复杂性等问题。
常用场景
经典使用场景
气候变化的推文数据集主要被用于分析和理解社交媒体上关于气候变化的公众讨论。该数据集通过整合图像分类、对象检测和情感分析,探索视觉叙述在气候话语中的作用,经典的使用场景包括对推文中的图像内容和情感进行分析,以揭示公众对气候变化的看法和态度。
衍生相关工作
基于该数据集,衍生出了许多相关的经典工作,如对气候变化图像的自动分类和情感分析,以及开发了用于探索和分析气候变化图像数据的图形用户界面。这些工作进一步推动了气候变化社交媒体研究的深度和广度。
数据集最近研究
最新研究方向
该研究以气候变化的推文数据集为对象,探讨了计算机视觉在分析视觉叙事方面的应用。研究运用了图像分类、对象检测和情感分析等方法,揭示了图像内容、情感和参与度之间的关键趋势。特别是在计算机视觉模型的应用上,研究展示了基础模型在分析社交媒体图像方面的潜力,并指出了现有模型的局限性和进一步改进的必要性。此外,研究还开发了一个交互式图形用户界面,以促进对模型预测的深入评估。这一研究方向为气候变化的社交媒体传播提供了新的视角,对于理解公众观点和叙事具有重要作用。
相关研究论文
- 1Deep Learning for Climate Action: Computer Vision Analysis of Visual Narratives on X德国曼海姆大学数据与网络科学组,慕尼黑工业大学治理学院,德国曼海姆大学及马克斯·普朗克信息学院 · 2025年
以上内容由遇见数据集搜集并总结生成



