five

neoneye/simon-arc-lab-image-pair-v7

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-lab-image-pair-v7
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为simons ARC(抽象与推理语料库)实验室的imagepair版本7,主要用于图像到文本和文本到图像的任务。数据集的图像大小经过多次调整,从Version 1到Version 7,图像的大小逐渐调整以优化模型的训练效果。Version 7的图像大小为宽度1-15,高度10-20。数据集的语言为英语,规模在10K到100K之间。

The dataset is named simons ARC (abstraction & reasoning corpus) lab imagepair version 7, primarily used for image-to-text and text-to-image tasks. The image sizes in the dataset have been adjusted multiple times from Version 1 to Version 7 to optimize the training effect of the model. The image size for Version 7 is width 1-15, height 10-20. The language of the dataset is English, and the size category is between 10K and 100K.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别:
    • 图像到文本
    • 文本到图像
  • 语言: 英语
  • 数据集名称: simons ARC (abstraction & reasoning corpus) lab imagepair version 7
  • 数据集大小: 10K<n<100K
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data.jsonl

版本信息

Version 1

  • 图像尺寸: 1-10
  • 任务: 比较两张图像的直方图

Version 2

  • 图像尺寸: 1-20
  • 任务: 直方图去除其他颜色,排除两张图像直方图之间的颜色
  • 问题: 较大的图像导致模型学习困难

Version 3

  • 图像尺寸: 宽度 1-20,高度 1-5
  • 效果: 训练效果更好

Version 4

  • 图像尺寸: 宽度 1-5,高度 1-20

Version 5

  • 图像尺寸: 宽度 1-10,高度 1-20

Version 6

  • 图像尺寸: 宽度 1-15,高度 10-30
  • 问题: 对大型语言模型(LLM)来说学习过于困难

Version 7

  • 图像尺寸: 宽度 1-15,高度 10-20
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作