vcr-org/VCR-wiki-en-hard-test-500
收藏Hugging Face2024-07-28 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vcr-org/VCR-wiki-en-hard-test-500
下载链接
链接失效反馈官方服务:
资源简介:
VCR-Wiki数据集用于视觉字幕恢复(VCR)任务,旨在评估视觉语言模型在图像中恢复部分遮挡文本的能力。数据集包含图像、堆叠图像、仅包含文本的图像、字幕以及被遮挡的文本片段。数据集的构建过程包括数据收集、初始过滤、N-gram选择、创建嵌入文本的图像、图像拼接和第二轮过滤。数据集的特征包括question_id、image、stacked_image、only_it_image、caption和crossed_text。数据集的许可证为CC BY-SA 4.0,适用于研究和教育用途。
VCR-Wiki数据集用于视觉字幕恢复(VCR)任务,旨在评估视觉语言模型在图像中恢复部分遮挡文本的能力。数据集包含图像、堆叠图像、仅包含文本的图像、字幕以及被遮挡的文本片段。数据集的构建过程包括数据收集、初始过滤、N-gram选择、创建嵌入文本的图像、图像拼接和第二轮过滤。数据集的特征包括question_id、image、stacked_image、only_it_image、caption和crossed_text。数据集的许可证为CC BY-SA 4.0,适用于研究和教育用途。
提供机构:
vcr-org



