five

erjiaxiao/Typographic-Dataset

收藏
Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/erjiaxiao/Typographic-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Typographic数据集旨在探索排版对大型视觉语言模型(LVLMs)在不同认知任务中表现的影响。数据集包含多个任务特定和因素特定的目录,如物种识别、颜色识别、计数、形状识别、纹理识别、大小识别和复杂推理任务。此外,数据集还研究了字体颜色、字体透明度、字体大小、位置和重复等因素对模型表现的影响。

The Typographic Dataset is curated to explore the impact of typography on the performance of Large Vision Language Models (LVLMs) across different cognitive tasks. It includes task-specific directories such as object recognition, color recognition, counting, shape recognition, texture recognition, object size recognition, and commonsense reasoning, as well as factor-specific directories like font color, font opacity, font size, position, and repetition.
提供机构:
erjiaxiao
原始信息汇总

数据集概述

简介

Typographic Dataset 是一个专门设计来研究印刷字体对大型视觉语言模型(LVLMs)在不同认知任务中表现影响的数据集。用户可以从这里下载 Typographic Dataset.zip 并将其内容解压到代码库中。

任务特定目录

  • Species: 对象识别任务。
  • Color: 颜色识别任务。
  • Counting: 枚举任务。
  • Shape: 几何形状识别任务。
  • Texture: 纹理识别任务。
  • Size: 对象大小识别任务。
  • Complex: 常识推理任务。

因素特定目录

  • Font Color: 研究不同颜色的印刷错误的影响。
  • Font Opacity: 检查不同不透明度级别的印刷错误的影响。
  • Font Size: 分析不同字体大小的印刷错误的影响。
  • Position: 研究放置在不同位置的印刷错误的影响。
  • Repetition: 评估不同数量印刷错误的影响。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作