five

neoneye/simon-arc-rle-image-v19

收藏
Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v19
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要用于图像到文本和文本到图像的任务,包含多个版本,每个版本针对不同的图像处理任务进行了调整,如图像旋转、颜色计数、像素匹配等。图像大小在不同版本中有所变化,从1像素到30像素不等。数据集的语言为英语,大小在10K到100K之间。

The simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 19 dataset is designed for image-to-text and text-to-image tasks. It includes various image processing and analysis techniques such as rotation, compression, and color counting. The image sizes vary across different versions, ranging from 1 to 30 pixels. The dataset aims to help language models (LLMs) learn image processing and analysis tasks, particularly in handling rotated images and counting neighboring pixels. The dataset contains between 10K and 100K items and is licensed under the MIT license.
提供机构:
neoneye
原始信息汇总

simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 19

数据集概述

  • 任务类别:
    • 图像到文本
    • 文本到图像
  • 语言:
    • 英语
  • 数据集名称:
    • simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 19
  • 数据集大小:
    • 10K<n<100K
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data.jsonl

版本更新

Version 1

  • 数据项类型: 各类型数据项分布均匀
  • 图像尺寸: 1-10像素
  • 问题: 旋转图像导致问题

Version 2

  • 数据项类型: 多数为旋转图像
  • 图像尺寸: 1-5像素
  • 改进: 验证损失有所改善

Version 3

  • 重点: count_same_color_as_center_with_8neighbors_nowrap
  • 图像尺寸: 1-6像素
  • 问题: 仍存在count_same_color_as_center_with_8neighbors_nowrap的困难

Version 4

  • 图像尺寸: 1-5像素
  • 新增: same_color_inside_3x3_area_nowrap
  • 改进: 略有帮助,但计数邻居仍不理想

Version 5

  • 新增: pixels_with_k_matching_neighbors (k参数1-8)
  • 图像尺寸: 1-6像素
  • 改进: 有助于计数周围像素

Version 6

  • 图像尺寸: 1-11像素

Version 7

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 1-12像素
  • 改进: LLM已掌握

Version 8

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 5-20像素

Version 9

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 10-30像素

Version 10

  • 图像尺寸: 宽度10-30像素,高度2-5像素

Version 11

  • 图像尺寸: 宽度2-5像素,高度10-30像素

Version 12

  • 重点: k-nearest neighbors
  • 图像尺寸: 宽度2-5像素,高度10-30像素

Version 13

  • 重点: compres_x, compres_y, compres_xy
  • 图像尺寸: 1-10像素

Version 14

  • 重点: 直方图和k-nearest-neighbors
  • 图像尺寸: 5-20像素

Version 15

  • 重点: 直方图和k-nearest-neighbors
  • 图像尺寸: 10-30像素

Version 16

  • 重点: k-nearest-neighbors
  • 图像尺寸: 10-25像素

Version 17

  • 禁用: k-nearest-neighbors
  • 图像尺寸: 15-30像素

Version 18

  • 禁用: k-nearest-neighbors和压缩
  • 图像尺寸: 15-25像素

Version 19

  • 变换: 禁用旋转和转置,x/y平移±1
  • 图像尺寸: 22-30像素
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作