five

Twitter-COMMs

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Twitter-COMMs
下载链接
链接失效反馈
官方服务:
资源简介:
检测断章取义的媒体,例如 Twitter 上的“字幕错误”图像,是一个相关问题,尤其是在具有高度公共意义的领域。 Twitter-COMMs 是一个大规模的多模式数据集,包含 884k 条与气候变化、COVID-19 和军用车辆主题相关的推文。该数据集可用于开发检测社交媒体平台上与这三个主题相关的错误信息的方法。

Detecting miscontextualized media—such as images with "caption errors" on Twitter—represents a salient issue, particularly in domains of high public significance. Twitter-COMMs is a large-scale multimodal dataset containing 884,000 tweets associated with three core topics: climate change, COVID-19, and military vehicles. This dataset can be leveraged to develop methods for detecting misinformation related to these three topics on social media platforms.
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Twitter-COMMs是一个大规模多模态数据集,包含884k条关于气候变化、COVID-19和军用车辆的推文,旨在支持社交媒体平台上的错误信息检测方法开发。该数据集由加州大学于2021年发布,专注于解决断章取义媒体等问题。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作