academic-datasets/AMMeBa
收藏数据集卡片:AMMeBa: Annotated Misinformation, Media-Based
数据集详情
该数据集是基于两年的研究成果,使用人工评分员对在线媒体(主要为图像)中的错误信息进行标注。这些标注基于在大量公开可访问的事实核查中评估的声明,使用了ClaimReview标记。数据集展示了图像类型学,旨在捕捉与图像在错误信息声明中的角色相关的图像和操纵方面。数据集还展示了生成式AI内容在错误信息声明中的兴起,以及历史上的“简单”方法(特别是上下文操纵)在数据收集结束时(2023年11月)仍占多数。
数据集描述
- 语言(NLP): 英语
- 许可证: cc-by-4.0
数据集来源
- 仓库: https://www.kaggle.com/datasets/googleai/in-the-wild-misinformation-media/
- 论文: https://arxiv.org/abs/2405.11697
使用
直接使用
该数据集适用于评估现实环境中错误信息缓解方法的有效性,并作为在线错误信息类型和模式的首次普查。
超出范围使用
该部分信息待补充。
数据集结构
该部分信息待补充。
数据集创建
策划理由
该部分信息待补充。
源数据
数据收集和处理
该部分信息待补充。
源数据生产者
该部分信息待补充。
标注
标注过程
该部分信息待补充。
标注者
该部分信息待补充。
个人和敏感信息
该部分信息待补充。
偏差、风险和限制
该部分信息待补充。
建议
用户应了解数据集的风险、偏差和技术限制。进一步的建议待补充。
引用
BibTeX:
bibtex @misc{dufour2024ammeba, title={AMMeBa: A Large-Scale Survey and Dataset of Media-Based Misinformation In-The-Wild}, author={Nicholas Dufour and Arkanath Pathak and Pouya Samangouei and Nikki Hariri and Shashi Deshetti and Andrew Dudfield and Christopher Guess and Pablo Hernández Escayola and Bobby Tran and Mevan Babakar and Christoph Bregler}, year={2024}, eprint={2405.11697}, archivePrefix={arXiv}, primaryClass={cs.CY} }



