erjiaxiao/Typographic-Dataset
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/erjiaxiao/Typographic-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
Typographic数据集旨在探索排版对大型视觉语言模型(LVLMs)在不同认知任务中表现的影响。数据集包含多个任务特定和因素特定的目录,如物种识别、颜色识别、计数、形状识别、纹理识别、大小识别和复杂推理任务。此外,数据集还研究了字体颜色、字体透明度、字体大小、位置和重复等因素对模型表现的影响。
The Typographic Dataset is curated to explore the impact of typography on the performance of Large Vision Language Models (LVLMs) across different cognitive tasks. It includes task-specific directories such as object recognition, color recognition, counting, shape recognition, texture recognition, object size recognition, and commonsense reasoning, as well as factor-specific directories like font color, font opacity, font size, position, and repetition.
提供机构:
erjiaxiao
原始信息汇总
数据集概述
简介
Typographic Dataset 是一个专门设计来研究印刷字体对大型视觉语言模型(LVLMs)在不同认知任务中表现影响的数据集。用户可以从这里下载 Typographic Dataset.zip 并将其内容解压到代码库中。
任务特定目录
- Species: 对象识别任务。
- Color: 颜色识别任务。
- Counting: 枚举任务。
- Shape: 几何形状识别任务。
- Texture: 纹理识别任务。
- Size: 对象大小识别任务。
- Complex: 常识推理任务。
因素特定目录
- Font Color: 研究不同颜色的印刷错误的影响。
- Font Opacity: 检查不同不透明度级别的印刷错误的影响。
- Font Size: 分析不同字体大小的印刷错误的影响。
- Position: 研究放置在不同位置的印刷错误的影响。
- Repetition: 评估不同数量印刷错误的影响。



