neoneye/simon-arc-lab-image-pair-v7
收藏Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-lab-image-pair-v7
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为simons ARC(抽象与推理语料库)实验室的imagepair版本7,主要用于图像到文本和文本到图像的任务。数据集的图像大小经过多次调整,从Version 1到Version 7,图像的大小逐渐调整以优化模型的训练效果。Version 7的图像大小为宽度1-15,高度10-20。数据集的语言为英语,规模在10K到100K之间。
The dataset is named simons ARC (abstraction & reasoning corpus) lab imagepair version 7, primarily used for image-to-text and text-to-image tasks. The image sizes in the dataset have been adjusted multiple times from Version 1 to Version 7 to optimize the training effect of the model. The image size for Version 7 is width 1-15, height 10-20. The language of the dataset is English, and the size category is between 10K and 100K.
提供机构:
neoneye
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别:
- 图像到文本
- 文本到图像
- 语言: 英语
- 数据集名称: simons ARC (abstraction & reasoning corpus) lab imagepair version 7
- 数据集大小: 10K<n<100K
- 配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data.jsonl
版本信息
Version 1
- 图像尺寸: 1-10
- 任务: 比较两张图像的直方图
Version 2
- 图像尺寸: 1-20
- 任务: 直方图去除其他颜色,排除两张图像直方图之间的颜色
- 问题: 较大的图像导致模型学习困难
Version 3
- 图像尺寸: 宽度 1-20,高度 1-5
- 效果: 训练效果更好
Version 4
- 图像尺寸: 宽度 1-5,高度 1-20
Version 5
- 图像尺寸: 宽度 1-10,高度 1-20
Version 6
- 图像尺寸: 宽度 1-15,高度 10-30
- 问题: 对大型语言模型(LLM)来说学习过于困难
Version 7
- 图像尺寸: 宽度 1-15,高度 10-20



