MCA-Bench
收藏arXiv2025-06-06 更新2025-06-10 收录
下载链接:
https://www.kaggle.com/datasets/luffy798/mca-benchmultimodal-captchas
下载链接
链接失效反馈官方服务:
资源简介:
MCA-Bench是一个包含四种模态的端到端CAPTCHA安全基准测试,包括静态视觉识别、点击定位、交互操作和文本逻辑问答,涵盖了20个现实世界中的任务。该数据集提供了超过180000个训练样本和一个包含4000个项目的测试集(每个任务200个示例),分为四个集群,分别评估OCR对视觉噪声的鲁棒性、复杂场景中的目标检索、类似人类的交互行为和多步骤语言推理。数据集样本包括点选定位、静态视觉识别、文本逻辑问答和交互操作。MCA-Bench旨在提供一个统一的评估平台,用于评估不同模态和任务中的CAPTCHA安全性。
MCA-Bench is an end-to-end CAPTCHA security benchmark encompassing four modalities: static visual recognition, click localization, interactive operation, and textual logical question answering. It covers 20 real-world tasks. This dataset provides over 180,000 training samples and a test set with 4,000 items (200 examples per task), which is divided into four clusters. These clusters respectively evaluate the robustness of OCR against visual noise, object retrieval in complex scenarios, human-like interactive behaviors, and multi-step linguistic reasoning. The dataset samples include click localization, static visual recognition, textual logical question answering, and interactive operations. MCA-Bench aims to provide a unified evaluation platform for assessing CAPTCHA security across different modalities and tasks.
提供机构:
西南大学,新加坡国立大学
创建时间:
2025-06-06
原始信息汇总
MCA-Bench 数据集概述
基本信息
- 数据集名称: MCA-Bench
- 描述: 一个包含视觉、行为和推理任务的多模态CAPTCHA数据集
- 创建者: luffy798
- 最后更新: 12天前
- 版本: 1.0
- 发布日期: 2025-05-23
数据集详情
- 数据类型: 多模态(视觉、行为、推理)
- 文件数量: 272k
- 列数: 43
- 大小: 4.89 GB
- 文件格式: JSON (dataset.croissant(2).json, 5.48 kB)
许可证
- 许可证类型: CC BY-SA 4.0
- 许可证链接: https://creativecommons.org/licenses/by-sa/4.0/
使用情况
- 可用性评分: 5.00
- 使用场景:
- 学习: 0
- 研究: 1
- 应用: 0
- LLM微调: 1
活动数据
- 总浏览量: 51 (最近30天)
- 下载量: 0 (最近30天)
- 互动率: 0.00000 (每次浏览的下载量)
标签
- Computer Vision
- AutoML
- Feature Extraction
- Image Text Recognition
搜集汇总
数据集介绍

构建方式
MCA-Bench数据集的构建采用了多模态融合的策略,涵盖了静态视觉识别、点选定位、交互操作和文本逻辑推理四大类任务。通过半自动化的数据收集流程,结合人工筛选与优化,确保了数据的高质量和多样性。具体而言,静态视觉识别任务通过字符级几何扰动和随机干扰生成器创建挑战性样本;点选定位任务则利用可控的图像生成过程,结合公共视觉数据集,构建了语义丰富的场景;交互行为任务则通过大规模人工采样,捕捉真实用户的操作轨迹,以模拟人类行为模式。
使用方法
MCA-Bench数据集的使用方法灵活多样,适用于多种研究场景。研究人员可以通过统一的接口访问数据集,加载预训练的视觉-语言模型(如QwenVL-2.5-7B),并利用LoRA适配器进行任务特定的微调。数据集的评估框架以通过率为核心指标,支持对模型在各类CAPTCHA任务上的表现进行系统分析。此外,数据集还提供了详细的实验设置和计算资源信息,便于复现和扩展研究。
背景与挑战
背景概述
MCA-Bench是由西南大学和新加坡国立大学的研究团队于2025年提出的首个多模态CAPTCHA安全评估基准。该数据集针对当前自动化攻击技术快速发展的背景,旨在解决传统CAPTCHA方案在模态多样性(包括静态扭曲文本、混淆图像、交互式点击、滑动拼图和逻辑问题等)评估中缺乏统一大规模基准的问题。通过整合20种真实场景任务和超过18万训练样本,MCA-Bench建立了跨模态的安全评估协议,并首次定量分析了挑战复杂度、交互深度与模型可解性之间的关联关系,为系统化的CAPTCHA强化设计提供了理论基础。
当前挑战
MCA-Bench面临的挑战主要体现在两个维度:在领域问题层面,需解决多模态CAPTCHA(如视觉识别、点击定位、交互操作和逻辑推理)对抗视觉-语言模型攻击时的鲁棒性评估难题,特别是复杂交互任务中人类行为模拟与机器决策的差异性;在构建过程层面,存在四大技术挑战:1)跨模态数据标注的统一协议设计,2)真实用户交互轨迹的建模与仿真,3)动态生成CAPTCHA的复杂度量化,4)对抗性样本在评估框架中的集成。实验表明,简单视觉任务的破解准确率可达96%,而需要多步推理的复杂任务成功率仅2.5%,凸显了安全性与可用性的平衡难题。
常用场景
经典使用场景
在网络安全领域,验证码(CAPTCHA)作为区分人类用户与自动化程序的关键工具,其安全性和鲁棒性一直是研究热点。MCA-Bench数据集通过整合静态视觉识别、点击定位、交互操作和文本逻辑问答四大类任务,为评估验证码在视觉-语言模型(VLM)攻击下的鲁棒性提供了统一基准。该数据集最经典的使用场景包括:利用其多样化的验证码样本(如扭曲文本、几何图形识别、滑动拼图等)训练和测试VLM代理,以量化不同验证码类型在复杂攻击环境下的脆弱性。例如,研究者可通过微调QwenVL-2.5-7B等模型,系统分析交互深度与语义复杂度对攻击成功率的影响。
解决学术问题
MCA-Bench填补了验证码研究领域长期缺乏多模态统一评估基准的空白,解决了三个核心学术问题:其一,通过标准化20种真实任务(如九宫格点击、算术字符识别等),首次实现了跨模态验证码安全性的横向对比;其二,揭示了验证码设计参数(如视觉混淆程度、交互步骤数)与模型可破解性之间的定量关系,例如实验表明简单视觉任务攻击成功率高达96%,而多步逻辑任务仅2.5%;其三,提出了任务驱动的标注框架,为验证码的细粒度安全评估提供了可扩展的协议。这些成果为构建抗攻击验证码系统奠定了理论基础。
实际应用
在实际应用中,MCA-Bench的评估结果直接指导了高安全性验证码的设计优化。例如,金融机构可依据数据集中滑动拼图任务对轨迹行为的强依赖性(80%抗破解成本),优先部署此类交互式验证码;教育平台则可通过文本逻辑问答任务的表现差异(人类97% vs 模型28%准确率),调整题目复杂度以平衡安全性与用户体验。此外,该数据集支持对抗样本生成,帮助开发者模拟高级持续性威胁(APT)攻击,从而增强验证码的动态防御能力。
数据集最近研究
最新研究方向
随着人工智能技术的迅猛发展,CAPTCHA(全自动区分计算机和人类的公开图灵测试)作为抵御恶意机器人的关键防线,其安全性面临前所未有的挑战。MCA-Bench作为首个多模态CAPTCHA基准测试套件,整合了静态视觉识别、点击定位、交互操作和文本逻辑推理四大类共20项现实任务,为评估CAPTCHA在视觉语言模型(VLM)攻击下的鲁棒性提供了统一框架。该数据集通过微调专用破解代理,首次量化分析了挑战复杂度、交互深度与模型可解性之间的关联,揭示了现代CAPTCHA设计在简单任务中高达96%的破解率,而在需要物理交互或多步逻辑的复杂任务中成功率骤降至2.5%的脆弱性谱系。当前研究热点聚焦于三个方向:基于深度模态耦合的新型验证系统设计,通过融合视觉线索定位与逻辑推理构建连续挑战管道;行为锚定验证技术,利用真实用户交互轨迹特征甄别自动化脚本;以及会话特定语义个性化机制,通过动态生成上下文相关的语义种子抵御预计算攻击。MCA-Bench的开源发布不仅推动了CAPTCHA攻防研究的标准化进程,更为构建兼顾安全性与用户体验的下一代认知安全验证体系奠定了理论基础。
相关研究论文
- 1MCA-Bench: A Multimodal Benchmark for Evaluating CAPTCHA Robustness Against VLM-based Attacks西南大学,新加坡国立大学 · 2025年
以上内容由遇见数据集搜集并总结生成



