neoneye/simon-arc-rle-image-v17
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v17
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于图像到文本和文本到图像任务的英语数据集,包含多个版本,每个版本针对不同的图像处理任务进行了调整,如图像旋转、颜色计数、像素匹配等。数据集大小在10K到100K之间。
The dataset, named simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 17, is primarily used for image-to-text and text-to-image tasks. It contains between 10K and 100K images, with image sizes ranging from 1 to 30 pixels. The dataset continuously adjusts image sizes and focuses on tasks such as rotating images and counting pixels of the same color to optimize the performance of the LLM. In the latest version 17, it specifically focuses on image sizes between 15 and 30 pixels and has disabled the k-nearest-neighbors technique to improve the models convergence speed.
提供机构:
neoneye
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别:
- 图像到文本
- 文本到图像
- 语言: 英语
- 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 17
- 数据集大小: 10K<n<100K
- 配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data.jsonl
版本更新
Version 1
- 数据项类型: 各类型数据项分布均匀。
- 图像尺寸: 1到10像素。
- 问题: 旋转图像导致问题。
Version 2
- 数据项类型: 多数为旋转图像。
- 图像尺寸: 1到5像素。
- 改进: 验证损失有所改善。
Version 3
- 重点:
count_same_color_as_center_with_8neighbors_nowrap和图像尺寸1-6。 - 问题: 仍存在
count_same_color_as_center_with_8neighbors_nowrap的困难。
Version 4
- 图像尺寸: 1到5像素。
- 新增:
same_color_inside_3x3_area_nowrap。 - 改进: 略有帮助,但计数邻居仍不理想。
Version 5
- 新增:
pixels_with_k_matching_neighbors,k参数为1-8。 - 图像尺寸: 1-6。
- 改进: 有助于改善邻居像素计数。
Version 6
- 权重: 所有变换权重相同。
- 图像尺寸: 1-11。
Version 7
- 重点: 直方图和k-nearest neighbors。
- 图像尺寸: 1-12。
- 改进: LLM已掌握。
Version 8
- 重点: 直方图和k-nearest neighbors。
- 图像尺寸: 5-20。
Version 9
- 重点: 直方图和k-nearest neighbors。
- 图像尺寸: 10-30。
Version 10
- 权重: 所有变换权重相同。
- 图像尺寸: 宽度10-30,高度2-5。
Version 11
- 权重: 所有变换权重相同。
- 图像尺寸: 宽度2-5,高度10-30。
Version 12
- 重点: k-nearest neighbors。
- 图像尺寸: 宽度2-5,高度10-30。
Version 13
- 重点:
compres_x,compres_y,compres_xy。 - 图像尺寸: 1-10。
Version 14
- 重点: 直方图和k-nearest-neighbors。
- 图像尺寸: 5-20。
Version 15
- 重点: 直方图和k-nearest-neighbors。
- 图像尺寸: 10-30。
Version 16
- 重点: k-nearest-neighbors。
- 图像尺寸: 10-25。
Version 17
- 重点: 禁用k-nearest-neighbors。
- 图像尺寸: 15-30。
- 原因: 怀疑是收敛缓慢的原因。



