five

neoneye/simon-arc-rle-image-v14

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/neoneye/simon-arc-rle-image-v14
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于图像到文本和文本到图像任务的数据集,主要包含不同版本的图像处理任务,如图像旋转、颜色计数、像素匹配等。图像大小在不同版本中有所变化,从1像素到30像素不等。数据集的语言为英语,大小在10K到100K之间。

The simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 14 is a dataset used for image-to-text and text-to-image tasks. It contains multiple versions with varying image sizes and task focuses, aimed at optimizing the performance of the learning model (LLM). The latest version 14 primarily focuses on histograms and k-nearest neighbors, with image sizes ranging from 5 to 20 pixels. The dataset is in English and has a size between 10K and 100K.
提供机构:
neoneye
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别:
    • 图像到文本
    • 文本到图像
  • 语言: 英语
  • 数据集名称: simons ARC (abstraction & reasoning corpus) RLE (run-length-encoding) image version 14
  • 数据集大小: 10K<n<100K
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data.jsonl

版本更新

Version 1

  • 数据项类型: 各类型数据项分布均匀
  • 图像尺寸: 1-10像素
  • 问题: 旋转图像导致问题

Version 2

  • 数据项类型: 多数为旋转图像
  • 图像尺寸: 1-5像素
  • 改进: 验证损失有所改善

Version 3

  • 重点: count_same_color_as_center_with_8neighbors_nowrap
  • 图像尺寸: 1-6像素
  • 问题: 仍存在计数问题

Version 4

  • 图像尺寸: 1-5像素
  • 新增: same_color_inside_3x3_area_nowrap
  • 改进: 计数问题略有改善

Version 5

  • 新增: pixels_with_k_matching_neighbors (k参数1-8)
  • 图像尺寸: 1-6像素
  • 改进: 计数问题有所改善

Version 6

  • 图像尺寸: 1-11像素
  • 权重: 所有变换权重相同

Version 7

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 1-12像素
  • 改进: LLM掌握情况良好

Version 8

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 5-20像素

Version 9

  • 重点: 直方图和k-nearest neighbors
  • 图像尺寸: 10-30像素

Version 10

  • 图像尺寸: 宽度10-30像素,高度2-5像素
  • 权重: 所有变换权重相同

Version 11

  • 图像尺寸: 宽度2-5像素,高度10-30像素
  • 权重: 所有变换权重相同

Version 12

  • 重点: k-nearest neighbors
  • 图像尺寸: 宽度2-5像素,高度10-30像素

Version 13

  • 重点: compres_x, compres_y, compres_xy
  • 图像尺寸: 1-10像素

Version 14

  • 重点: 直方图和k-nearest-neighbors
  • 图像尺寸: 5-20像素
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作