five

MuMiN

收藏
arXiv2022-03-08 更新2024-06-21 收录
下载链接:
https://mumin-dataset.github.io/
下载链接
链接失效反馈
官方服务:
资源简介:
MuMiN是一个大规模的多语言多模态事实核查错误信息社交网络数据集,由布里斯托大学工程数学系创建。该数据集包含2100万条推文,属于2.6万个Twitter线程,每个线程都与1.3万个经过事实核查的声明语义链接,涵盖数十个主题、事件和领域,跨越41种不同语言,时间跨度超过十年。数据集通过Python包mumin提供,旨在帮助研究人员开发和评估自动错误信息检测模型,解决社交媒体上的错误信息问题。

MuMiN is a large-scale multilingual multimodal fact-checking misinformation social network dataset, created by the Department of Engineering Mathematics, University of Bristol. This dataset contains 21 million Tweets belonging to 26,000 Twitter threads, each semantically linked to 13,000 fact-checked claims. It covers dozens of topics, events and domains, spans 41 different languages, and has a time span of over ten years. The dataset is provided via the Python package `mumin`, aiming to help researchers develop and evaluate automatic misinformation detection models to address the misinformation problem on social media.
提供机构:
布里斯托大学工程数学系
创建时间:
2022-02-24
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MuMiN是一个大规模多语言多模态事实核查的虚假信息社交网络数据集,结构为异构图,包含超过2100万条推文和190万用户,覆盖41种语言和10年时间,用于训练自动虚假信息检测模型。数据集提供两个图分类任务:声明分类和推文分类,旨在预测声明或推文是否涉及虚假信息,支持多语言和多模态分析。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作