ClimateTV

Name: ClimateTV
Creator: 曼海姆大学
Published: 2024-12-02 17:09:47
License: 暂无描述

arXiv2024-12-02 更新2024-12-06 收录

下载链接：

https://github.com/KathPra/MP4VisualFrameDetection

下载链接

链接失效反馈

官方服务：

资源简介：

ClimateTV数据集是由曼海姆大学和慕尼黑工业大学的研究团队创建的，专门用于气候变化相关的视觉框架分析。该数据集包含了2019年1月在X（原Twitter）上分享的与气候变化相关的图像，涵盖了动物类别、政治抗议、气候变化解决方案及后果等多个主题。数据集的创建旨在通过图像聚类技术，自动化地识别和分类这些图像中的视觉框架，从而减少手动标注的工作量，并提高分析效率。该数据集的应用领域主要集中在社会科学研究中，特别是气候变化相关的视觉内容分析。

The ClimateTV dataset was developed by a research team from the University of Mannheim and the Technical University of Munich for specialized visual framing analysis related to climate change. It contains climate change-related images shared on X (formerly Twitter) in January 2019, covering multiple themes including animal-related topics, political protests, climate change solutions and their consequences. The dataset was created to automatically identify and classify visual frames in these images via image clustering techniques, thereby reducing manual annotation workload and improving analysis efficiency. Its primary application focuses on social science research, especially visual content analysis related to climate change.

提供机构：

曼海姆大学

创建时间：

2024-12-02

搜集汇总

数据集介绍

构建方式

ClimateTV数据集的构建基于气候变化相关的社交媒体图像，这些图像主要来源于2019年1月在X（原Twitter）上分享的内容。数据集的构建过程中，研究者通过图像聚类技术，将视觉框架分析任务转化为最小成本多割问题（Minimum Cost Multicut Problem, MP），从而显著减少了人工标注的工作量。该数据集包含了多种视觉框架，如形式/风格框架和内容导向框架，这些框架通过不同的嵌入空间（如DINOv2和ConvNeXt V2）进行检测和分类。

特点

ClimateTV数据集的显著特点在于其广泛涵盖了气候变化相关的视觉内容，包括政治抗议、会议、气候变化解决方案（如风能）以及气候变化后果（如洪水、干旱、经济不稳定和侵犯人权）。数据集通过多种先进的视觉基础模型进行嵌入和聚类，能够捕捉到细微的视觉差异，从而为社会科学研究提供了丰富的数据支持。此外，该数据集的构建方法不依赖于预定义的框架，减少了结果的偏见，使得新框架的发现成为可能。

使用方法

使用ClimateTV数据集时，研究者可以通过多种嵌入模型（如ResNet-50、VGG19-BN、Vision Transformer B/32、ConvNeXt V2、DINOv2和CLIP ViT-B/32）生成图像特征，并利用这些特征构建全连接图。图的边权重由图像嵌入的余弦相似度决定，随后通过最小成本多割问题的求解器（如Greedy Additive Edge Contraction和Kerninghan-Lin算法）将图像分割成不同的聚类。研究者可以通过比较不同嵌入模型的聚类结果，分析其对视觉框架检测的有效性，并进一步探索多模态聚类（如结合图像和文本输入）的可能性。

背景与挑战

背景概述

气候电视（ClimateTV）数据集由曼海姆大学和慕尼黑工业大学的研究人员于2023年创建，旨在通过视觉框架分析来理解气候变化的社会科学研究。该数据集包含了2019年1月在社交媒体平台上分享的与气候变化相关的图像，这些图像被用于视觉框架分析，以确定在特定话语中的共同主题和概念。通过将聚类任务表述为最小成本多割问题（Minimum Cost Multicut Problem），研究人员能够显著减少手动注释的工作量，并最大化从提供的局部成对概率中获得的聚类后验概率。这一方法在社会科学研究中具有重要意义，因为它不仅加速了注释过程，还减少了预定义框架带来的偏见，从而能够更准确地检测新兴框架。

当前挑战

气候电视数据集在构建和应用过程中面临多项挑战。首先，视觉框架分析的自动化程度较低，数据集通常需要手动注释，这限制了其在大规模应用中的效率。其次，内容导向的框架检测自动化是一个更为复杂的任务，需要克服抽象和多样化概念检测的难题。此外，数据集的构建过程中，如何从海量的社交媒体图像中筛选出具有代表性的样本，确保数据集的多样性和代表性，也是一个重要的挑战。最后，尽管最小成本多割问题在图像聚类中显示出优越性，但其计算复杂性和对高质量嵌入空间的依赖，仍然是实际应用中需要解决的问题。

常用场景

经典使用场景

ClimateTV数据集在社会科学研究中被广泛用于视觉框架分析，通过图像聚类显著加速了注释过程。该数据集将聚类任务表述为最小成本多割问题（Minimum Cost Multicut Problem, MP），利用图像相似性作为输入，生成最大化后验概率的聚类结果。这一方法在检测视觉框架方面表现出色，特别是在使用DINOv2和ConvNeXt V2嵌入空间时，能够有效区分粗粒度和细粒度的视觉差异。

衍生相关工作

ClimateTV数据集的提出催生了一系列相关研究工作。例如，研究人员利用该数据集探索了不同嵌入空间在视觉框架检测中的效果，提出了基于最小成本多割问题的聚类方法。此外，该数据集还促进了多模态数据融合的研究，如结合图像和文本输入进行更精确的视觉框架分析。这些研究不仅提升了视觉框架检测的准确性，还为其他领域的图像分析提供了新的思路和方法。

数据集最近研究