neoneye/simon-arc-rle-image-v7
收藏Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v7
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于图像到文本和文本到图像任务的数据集,主要包含不同版本的图像处理任务。每个版本都针对LLM在处理旋转图像、颜色计数和邻居像素匹配等问题上的困难进行了优化。图像大小在不同版本中有所变化,主要集中在1到12像素之间。数据集的目标是通过不断调整图像大小和任务类型,提高LLM在这些任务上的表现。
simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 7 is a dataset primarily used for image-to-text and text-to-image tasks. It contains various types of images with sizes ranging from 1 to 12 pixels. The dataset has versions from 1 to 7, each focusing on different aspects and improvements such as handling rotated images, adjusting image sizes, color counting, and neighboring pixel counting. The dataset is in English and has a size between 10K and 100K.
提供机构:
neoneye
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别:
- 图像到文本
- 文本到图像
- 语言: 英语
- 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 7
- 数据集大小: 10K<n<100K
- 配置:
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data.jsonl
版本更新
Version 1
- 描述: 数据集项类型分布较为均匀。LLM在某些类型上表现良好,但旋转图像存在问题。
- 图像大小: 1到10像素
Version 2
- 描述: 数据集项主要为旋转图像,以解决LLM在此类图像上的困难。
- 图像大小: 1到5像素
- 效果: 验证损失有所改善。
Version 3
- 描述: 主要关注
count_same_color_as_center_with_8neighbors_nowrap和图像大小1-6。LLM在此类任务上表现不佳,可能由于图像尺寸过大。 - 图像大小: 1到6像素
Version 4
- 描述: 再次尝试使用更小的图像,图像大小为1到5像素。添加了
same_color_inside_3x3_area_nowrap,可能与count_same_color_as_center_with_8neighbors_nowrap有协同作用。 - 图像大小: 1到5像素
- 效果: 略有帮助,但仍未达到理想的邻居计数效果。
Version 5
- 描述: 添加了
pixels_with_k_matching_neighbors,k参数在1-8之间,以改进邻居像素计数。 - 图像大小: 1到6像素
- 效果: 确实有助于改进邻居像素计数。
Version 6
- 描述: 所有变换的权重相同。
- 图像大小: 1到11像素
Version 7
- 描述: 重点关注直方图和k-最近邻算法。
- 图像大小: 1到12像素
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



