neoneye/simon-arc-rle-image-v13
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v13
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要用于图像到文本和文本到图像的任务,语言为英语。数据集的大小在10K到100K之间。每个版本的更新主要集中在图像大小、旋转图像、颜色计数、邻居像素匹配等方面,目的是提高模型在处理这些任务时的性能。
The simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 13 is a dataset focused on image-to-text and text-to-image tasks. It contains multiple versions, each optimized for different image sizes and processing focuses. For example, version 13 primarily focuses on image compression (`compres_x`, `compres_y`, `compres_xy`) with image sizes ranging from 1 to 10 pixels. The dataset aims to assist large language models (LLM) in learning and processing various types of image data, particularly rotated and compressed images.
提供机构:
neoneye
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别:
- 图像到文本
- 文本到图像
- 语言: 英语
- 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 13
- 数据集大小: 10K<n<100K
- 配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data.jsonl
版本更新
Version 1
- 数据项类型: 各类型数据项分布均匀。
- 图像尺寸: 1到10像素。
- 问题: 旋转图像导致问题。
Version 2
- 数据项类型: 多数为旋转图像。
- 图像尺寸: 1到5像素。
- 改进: 验证损失有所改善。
Version 3
- 重点:
count_same_color_as_center_with_8neighbors_nowrap和图像尺寸1-6。 - 问题: 仍存在
count_same_color_as_center_with_8neighbors_nowrap的困难。
Version 4
- 图像尺寸: 1到5像素。
- 新增:
same_color_inside_3x3_area_nowrap。 - 改进: 略有帮助,但计数邻居仍有不足。
Version 5
- 新增:
pixels_with_k_matching_neighbors,k参数为1-8。 - 图像尺寸: 1-6。
- 改进: 有助于改善邻居像素计数。
Version 6
- 权重: 所有变换权重相同。
- 图像尺寸: 1-11。
Version 7
- 重点: 直方图和k近邻。
- 图像尺寸: 1-12。
- 改进: LLM已掌握。
Version 8
- 重点: 直方图和k近邻。
- 图像尺寸: 5-20。
Version 9
- 重点: 直方图和k近邻。
- 图像尺寸: 10-30。
Version 10
- 权重: 所有变换权重相同。
- 图像尺寸: 宽度10-30,高度2-5。
Version 11
- 权重: 所有变换权重相同。
- 图像尺寸: 宽度2-5,高度10-30。
Version 12
- 重点: k近邻。
- 图像尺寸: 宽度2-5,高度10-30。
Version 13
- 重点:
compres_x,compres_y,compres_xy。 - 图像尺寸: 1-10。



