neoneye/simon-arc-lab-image-pair-v3
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-lab-image-pair-v3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为simons ARC(抽象与推理语料库)实验室的imagepair版本3,主要用于图像到文本和文本到图像的任务。数据集包含三个版本,每个版本都涉及图像大小的变化和图像处理技术的改进。Version 1涉及图像大小1-10,并比较两幅图像的直方图。Version 2增加了图像大小到1-20,并引入了去除两幅直方图之间颜色的功能。Version 3进一步调整了图像大小,宽度为1-20,高度为1-5。这些改进旨在解决较大图像对模型学习造成的问题。
The simons ARC (abstraction & reasoning corpus) lab imagepair version 3 dataset is designed for image-to-text and text-to-image tasks. It contains between 10K and 100K samples, primarily in English. In the default configuration, training data is stored in the data.jsonl file. Version 3 features smaller image sizes, with widths ranging from 1 to 20 and heights from 1 to 5.
提供机构:
neoneye
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别:
- 图像到文本
- 文本到图像
- 语言: 英语
- 数据集名称: simons ARC (abstraction & reasoning corpus) lab imagepair version 3
- 数据规模: 10K<n<100K
配置信息
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data.jsonl
版本信息
Version 1
- 图像尺寸: 1-10
- 任务描述: 比较两张图像的直方图
Version 2
- 图像尺寸: 1-20
- 任务描述: 直方图排除两个直方图之间的颜色
- 问题: 较大的图像导致模型学习困难
Version 3
- 图像尺寸: 宽度 1-20, 高度 1-5



