academic-datasets/AMMeBa

Name: academic-datasets/AMMeBa
Creator: academic-datasets
Published: 2024-05-21 10:54:44
License: 暂无描述

Hugging Face2024-05-21 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/academic-datasets/AMMeBa

下载链接

链接失效反馈

官方服务：

资源简介：

AMMeBa数据集是一个关于在线媒体中错误信息的标注数据集，主要关注图像。该数据集基于公开可访问的事实核查样本，使用ClaimReview标记进行评估，并由人类评分者进行标注。数据集展示了一种图像类型学，旨在捕捉图像及其操纵的相关方面，以反映图像在错误信息声明中的作用。数据集还展示了生成式AI内容在错误信息声明中的兴起，并指出其普遍性是相对较新的现象。数据集公开可用，旨在评估现实环境中的缓解方法，并作为首次对在线错误信息类型和模式的普查。

提供机构：

academic-datasets

原始信息汇总

数据集卡片：AMMeBa: Annotated Misinformation, Media-Based

数据集详情

该数据集是基于两年的研究成果，使用人工评分员对在线媒体（主要为图像）中的错误信息进行标注。这些标注基于在大量公开可访问的事实核查中评估的声明，使用了ClaimReview标记。数据集展示了图像类型学，旨在捕捉与图像在错误信息声明中的角色相关的图像和操纵方面。数据集还展示了生成式AI内容在错误信息声明中的兴起，以及历史上的“简单”方法（特别是上下文操纵）在数据收集结束时（2023年11月）仍占多数。

数据集描述

语言(NLP): 英语
许可证: cc-by-4.0

数据集来源

仓库: https://www.kaggle.com/datasets/googleai/in-the-wild-misinformation-media/
论文: https://arxiv.org/abs/2405.11697

使用

直接使用

该数据集适用于评估现实环境中错误信息缓解方法的有效性，并作为在线错误信息类型和模式的首次普查。

超出范围使用

该部分信息待补充。

数据集结构

该部分信息待补充。

数据集创建

策划理由

该部分信息待补充。

源数据

数据收集和处理

该部分信息待补充。

源数据生产者

该部分信息待补充。

标注

标注过程

该部分信息待补充。

标注者

该部分信息待补充。

个人和敏感信息

该部分信息待补充。

偏差、风险和限制

该部分信息待补充。

建议

用户应了解数据集的风险、偏差和技术限制。进一步的建议待补充。

引用

BibTeX:

bibtex @misc{dufour2024ammeba, title={AMMeBa: A Large-Scale Survey and Dataset of Media-Based Misinformation In-The-Wild}, author={Nicholas Dufour and Arkanath Pathak and Pouya Samangouei and Nikki Hariri and Shashi Deshetti and Andrew Dudfield and Christopher Guess and Pablo Hernández Escayola and Bobby Tran and Mevan Babakar and Christoph Bregler}, year={2024}, eprint={2405.11697}, archivePrefix={arXiv}, primaryClass={cs.CY} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集